Venktesh ViswanathanBiträdande lektor
Om mig
Jag är biträdande universitetslektor i forskargruppen för datavetenskap vid DSV, Stockholms universitet.
Min forskning syftar till att utveckla robusta och effektiva pipelines för komplexa kunskapsintensiva
uppgifter för att underlätta en mängd olika verkliga tillämpningar, som sjukvård, utbildning, forskning och bekämpning av desinformation. Min forskning innebär att bygga robusta och effektiva pipelines för Retrieval Augmented Generation (RAG) drivna av stora språkmodeller (LLM) genom teoretiskt grundade framsteg inom maskininlärning (ML) som överbryggar klyftorna mellan hämtning och resonemang. För att förverkliga denna vision har jag utvecklat teoretiskt grundade samplingseffektiva algoritmer för beräkningsoptimal testtidsskalning vid hämtnings- och resonemangsstadier. Mitt arbete innebär också att utveckla robusta LLM-återkopplingsmetoder baserade på osäkerhetskvantifiering för att förbättra hämtning och resonemang vid slutledningstillfället. De resulterande arbetena har publicerats på WWW, WSDM, ECIR, CIKM, EMNLP, ICML, NAACL och SIGIR. Jag tjänstgör även regelbundet som granskare för NAACL, ACL, EMNLP, SIGKDD, SIGIR, AAAI, CIKM, WSDM, WWW, ECIR. Jag fungerar också som granskare för tidskrifter som ACM TOIS. Jag är för närvarande även programordförande för Reproducibility Track vid ECIR 2026.
Förutom publikationer har mitt arbete använts i stor skala för verklighetstrogna tillämpningar, som live-faktakontroll av amerikanska president- och EU-debatter av Factiveverse AI, Norge. Mitt arbete med effektiv hämtning för live-faktakontroll med samarbetspartners från UIS och Factiveverse vann "Best paper award" vid ECIR 2025.
Forskning
Min forskning fokuserar i stort sett på att hjälpa människor att hitta, verifiera och organisera information för sina komplexa informationsbehov. Till exempel skulle läkare i tvärvetenskapliga team enkelt kunna leta efter information somVilket är protokollet för att hantera viruset som orsakar akut andningssvikt?” genom sådana system och spara mycket tid vid manuell sökning över flera system för differentialdiagnos för att få protokollchecklistan. Systemen behöver dock utföra informationshämtning och resonemang över information i flera turer för att identifiera möjliga virus som orsakar dessa symtom och protokoll som identifierats under åren för att hantera dem och rangordna dem internt för att syntetisera den bästa checklistan. Därför ligger min forskning i skärningspunkten mellan NLP och IR och fokuserar även på att utveckla effektiva maskininlärningsmekanismer för att optimera dessa pipelines. Med utgångspunkt från den nuvarande uppfattningen att mer data och stora parametriska modeller är nödvändiga för att göra detta, föreslår jag samplingseffektiva och beräkningseffektiva pipelines genom att främja forskningen inom:
- Effektiv neural hämtning för frågor över stora korpusar (miljontals dokument)
- Effektivt resonemang (effektiv sökning över möjliga hypoteser för lösningar).
- Teoretiskt grundade banditramverk för proveffektiv utforskning.
- Främja återanvändning av modeller genom att utveckla nya färdigheter genom modellsammanslagning.