Stockholms universitet

Guilherme Dinis Chaliane JuniorDoktorand

Om mig

Jag är industridoktorand vid Data Science Group, inom Institutionen för data- och systemvetenskap vid Stockholms universitet. Jag jobbar även på Spotify, som ML-ingenjör.

Syftet med mitt arbete är att överbrygga gapet mellan teoretisk kunskap och dess tillämpning för att lösa verkliga beslutsfattande problem, särskilt i utrymmet av sekventiellt beslutsfattande där handlingar påverkar framtida situationer och resultat. Mitt forskningsämne är inom området sekventiellt beslutsfattande med metoder för förstärkning av lärande. För min forskning har jag undersökt utmaningar med lärande med fördröjd återkoppling, såsom bristen på återkopplingssignaler eller långa väntetider för att observera återkoppling. Jag arbetar med att mäta effekterna av dessa situationer på lärande agenter och utveckla metoder för att övervinna dessa utmaningar.
Inom industrin arbetar jag med att ta fram lösningar på vanliga problem som uppstår i rekommendatorsystem. Dessa problem omfattar lärande från partisk data, begränsad utforskningsbudget, lärande under osäkerhet och hantering av stora handlingsutrymmen.

Andra forskningsområden som intresserar mig är distribuerade system, problem med flera agenter och representationsinlärning.

Contact: guilherme@dsv.su.se

 

Publications

Dinis Junior, Guilherme, Sindri Magnússon, and Jaakko Hollmén. “Policy Control with Delayed, Aggregated Anonymous Feedback..” In Machine Learning and Knowledge Discovery in Databases: Research Track. ECML PKDD 2024
 
Baran, Buket, Guilherme Dinis Junior, Antonina Danylenko, Olayinka S. Folorunso, Gösta Forsum, Maksym Lefarov, Lucas Maystre, and Yu Zhao. “Accelerating Creator Audience Building through Centralized Exploration.” In Proceedings of the 17th ACM Conference on Recommender Systems, 70–73. RecSys ’23. New York, NY, USA: Association for Computing Machinery, 2023. https://doi.org/10.1145/3604915.3608880.
 
Movin, Maria, Guilherme Dinis Junior, Jaakko Hollmén, and Panagiotis Papapetrou. “Explaining Black Box Reinforcement Learning Agents Through Counterfactual Policies.” In Advances in Intelligent Data Analysis XXI, edited by Bruno Crémilleux, Sibylle Hess, and Siegfried Nijssen, 314–26. Cham: Springer Nature Switzerland, 2023. https://doi.org/10.1007/978-3-031-30047-9_25.
 
Dinis Junior, Guilherme, Sindri Magnússon, and Jaakko Hollmén. “Policy Evaluation with Delayed, Aggregated Anonymous Feedback.” In Discovery Science, edited by Poncelet Pascal and Dino Ienco, 114–23. Lecture Notes in Computer Science. Cham: Springer Nature Switzerland, 2022. https://doi.org/10.1007/978-3-031-18840-4_9.
 
Dinis, Guilherme, Nordin Zakaria, and Ken Naono. “Pluggable Scheduling on an Open-Source Based Volunteer Computing Infrastructure.” In 2014 International Conference on Computer and Information Sciences (ICCOINS), 1–7, 2014. https://doi.org/10.1109/ICCOINS.2014.6868823.