Belarus Big Data User Group MeetUp #11

17210_732233970230340_3141067296923735683_n

Программа:

19.00 – 19.40: Игорь Бобак, Lead Software Engineer at EPAM

“Обзор Spark MLLib”

В докладе будет рассказано о том, что из себя представляют задачи машинного обучения и сделан обзор алгоритмов, моделей и подходов, реализованных в библиотеке Spark MLLib.

19.40 – 20.20:  Валентин Базаревский, Senior Developer at Adform

“На темной стороне вероятностных структур данных”

Зачастую когда мы слышим про какую-нибудь новую технологию, алгоритм или структуру данных, мы слышим лишь сладкие речи. Уже потом, в процессе использования, мы сталкиваемся с ограничениями и недостатками (не смотря на то, что где-то она показывает эффективные результаты). На этом этапе многие опускают руки и начинают искать новую серебряную пулю.

В докладе, мы обсудим вероятностные структуры данных и связанные с ними алгоритмы, такие как фильтр Блума, HyperLogLog, MinHash, одну из разновидностей LSH, их достоинства и недостатки. С примерами из реальных проектов, связанных с обработкой больших массивов данных (15+ TB).

20.20 – 20.40: Кофе-пауза

20.40 – 21.20: Роман Меркулов, InData Labs

“Прогнозирование исходов спортивных событий с помощью машинного обучения”

Несмотря на множество успешных примеров применения методов машинного обучения в самых различных областях, вопрос об эффективности их использования в задачах прогнозирования исходов спортивных событий по-прежнему остаётся открытым. Постараемся на практическом примере построить модель спортивных прогнозов и оценить возможную пользу от неё.

Развернуть полное описание
Подписывайтесь и читайте
все обновления нашего сайта в удобном для вас месте!
Этот пушистик уже подписался! ;)