PyData Bydgoszcz - Meetup #33

Organizator: PyData Bydgoszcz
Partnerzy: Młyny Rothera

Informacje od Organizatora:
Zapraszamy na trzydzieste trzecie spotkanie grupy PyData Bydgoszcz!

Plan wydarzenia:
18:00-18:10 Wstęp
18:10-18:55 Krzysztof Kasprowicz: “Semantic Kernel – Wprowadzenie do agentów”
18:55-19:10 Przerwa
19:10-19:55 Piotr Pęzik, Marek Kozłowski, Agnieszka Karlińska: “Polskie duże modele językowe PLLuM”
19:55-20:05 Konkurs

O prelegentach:
Krzysztof Kasprowicz
Jestem programistą z 8-letnim doświadczeniem, specjalizującym się w technologiach .NET oraz DevOps. Moja pasja do backendu zaowocowała współpracą przy projektach dla klientów z różnych branż, takich jak prawo, finanse, medycyna i handel. Od półtora roku z zaangażowaniem rozwijam projekt AI open-source, jakim jest Semantic Kernel. Poza pracą oddaję się swojej pasji – skydivingowi, spędzając letnie weekendy na skokach ze spadochronem.

Dr hab. Piotr Pęzik, prof. UŁ
Jest kierownikiem Zakładu Językoznawstwa Korpusowego i Komputerowego w Uniwersytecie Łódzkim, autorem ponad 100 prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Był wykonawcą i kierownikiem krajowych i europejskich projektów badawczo-rozwojowych, m. in. NKJP, CESAR, PLEC, BootStrep. Konsultant naukowy sektora prywatnego (np. Pfizer UK, Transition Technologies, Voicelab) w zakresie systemów ekstrakcji informacji z danych językowych. Autor wyszukiwarek frazeo.pl, http://spokes.clarin-pl.eu/, http://monco-pl.clarin-pl.eu/, słowników frazeologicznych HASK EN i HASK PL. Koordynator projektu CLARIN-PL w Uniwersytecie Łódzkim. Główny autor i opiekun Wyszukiwarki PELCRA dla NKJP. Kierował pracą zespołu UŁ w projekcie PLLuM.

Dr Marek Kozłowski
Jest kierownikiem AI Labu w Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym. Zarządza pracą zespołu badaczy i programistów, który zajmuje się tworzeniem oprogramowania wzbogaconego inteligentnymi metodami przetwarzania danych tekstowych i obrazowych. Pasjonuje go przetwarzanie języka naturalnego, eksploracja danych i uczenie maszynowe. Autor ponad 50 publikacji naukowych z zakresu semantycznego przetwarzania tekstów i uczenia maszynowego. W swojej karierze brał udział w wielu komercyjnych projektach badawczych dotyczących uczenia maszynowego. Z efektów mojej pracy korzystały firmy, takie jak m.in. Samsung, France Telecom, Orange Labs, Millward Brown, Vive Textile Recycling czy Connectis. Brałem udział w międzynarodowych konkursach uczenia maszynowego, takich jak IEEE BigData 2019 Cup.

Dr Agnieszka Karlińska
Jest adiunktką w Ośrodku Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK PIB, gdzie zajmuje się z jednej strony tworzeniem narzędzi do wykrywania treści szkodliwych, takich jak mowa nienawiści, z drugiej zaś – budową bezpiecznych i wiarygodnych dużych modeli językowych. Skupia się w szczególności na ewaluacji skłonności LLM-ów do generowania treści toksycznych i dyskryminujących oraz na przeciwdziałaniu występowaniu obciążeń na różnych etapach tworzenia modeli. Z ramienia NASK kierowała projektem PLLuM, którego celem było utworzenie polskiego dużego modelu językowego. Aktualnie zajmuje się m.in. kwestiami związanymi z wdrażaniem polskich LLM-ów w administracji publicznej.

O wykładach:
Krzysztof Kasprowicz: “Semantic Kernel – Wprowadzenie do agentów”
Podczas tej prelekcji zapoznamy się z Semantic Kernel – lekkim, otwartoźródłowym zestawem narzędzi, który umożliwia łatwą integrację najnowszych modeli AI w kodzie C#, Python lub Java. SK działa jako efektywny framework, który pozwala na szybkie dostarczanie rozwiązań klasy korporacyjnej. Omówimy, czym jest Semantic Kernel i jakie problemy rozwiązuje, a także jak tworzy abstrakcję nad modelami językowymi i ich dostawcami, takimi jak np. OpenAI, Azure OpenAI, Hugging Face, Google Gemini. Pokażemy, jak tworzyć inteligentnych agentów, którzy mogą automatycznie wykonywać zadania na podstawie zapytań użytkowników, oraz jak dodawać istniejący kod jako wtyczki, aby maksymalizować inwestycje w usługi AI. Wykorzystamy również specyfikację OpenAPI do wykorzystania istniejących rest API jako wtyczki do kernela.

Piotr Pęzik, Marek Kozłowski, Agnieszka Karlińska: “Polskie duże modele językowe PLLuM”
Wystąpienie będzie poświęcone procesowi tworzenia polskich dużych modeli językowych dostosowanych do potrzeb administracji publicznej. Przedstawimy kluczowe aspekty prac nad modelami z rodziny PLLuM – od pozyskiwania danych uczących, przez pretrening (zarówno w wariancie jednojęzycznym, jak i w formie kontynuacji treningu w celu adaptacji językowej) i dostrajanie na instrukcjach (ang. instruction fine-tuning), po wychowanie (ang. alignment). Omówimy wyzwania metodologiczne pojawiające się na każdym z tych etapów oraz pokażemy, jak modele sprawdzają się w różnorodnych zadaniach. Zaprezentujemy również narzędzie do szybkiej konfiguracji i testowania systemów RAG oraz nasze podejście do walidacji zdolności wyszukiwawczych modeli.

Informacje organizacyjne:
Kiedy? 06.03.2025 r., godz. 18.00-21.00
Gdzie? Spichrz Zbożowy, II piętro
Dla kogo? dla wszystkich zainteresowanych tematyką
Cena: bezpłatnie
Zapisy: https://www.meetup.com/pydata-bydgoszcz/events/306342254/?eventOrigin=group_events_list

______________________
Kalendarz wydarzeń odbywających się w Bydgoszczy miej zawsze pod ręką dzięki aplikacji mobilnej (Android i iOS).
______________________
Informacje o wydarzeniach przesyłajcie na adres wydarzenia@visitbydgoszcz.pl
______________________
Bydgoskie Centrum Informacji nie ponosi odpowiedzialności za jakiekolwiek zmiany miejsc, godzin i dat wydarzeń.

Hotel Pomorski(Noclegi / Hotele***)

Kuchnia by Marcin Szukaj

PyData Bydgoszcz - Meetup #33

Informationszentrum