115
правок
Изменения
→Открытые наборы данных для обучения
* [https://golos.io/leave_page?http%3A%2F%2Fwww.openslr.org%2F12%2F LibriSpeech]: около 500 часов начитки аудиокниг, в исполнении разных людей. Данные организованы по главам книг, содержат текст и записи.
==== Системы рекомендаций и ранжирования ====
* [https://golos.io/leave_page?https%3A%2F%2Fwww.kaggle.com%2Fc%2Fmsdchallenge Million Song Dataset]: большой open source-датасет [https://www.kaggle.com/ Kaggle], насыщенный метаданными. Хороший вариант для тех, кто экспериментирует с гибридными системами рекомендаций.==== Сети и графы =====* [https://golos.io/leave_page?http%3A%2F%2Fsnap.stanford.edu%2Fdata%2F%23amazon Amazon Co-Purchasing] и [https://golos.io/leave_page?http%3A%2F%2Fsnap.stanford.edu%2Fdata%2Famazon-meta.html Amazon Reviews]: данные, собранные из раздела «Пользователи, купившие это, также выбирают…» на Amazon, а также обзоры сопутствующих товаров. Хорош для экспериментов рекомендательными системами в соцсетях.==== Геопространственные данные =====* [https://golos.io/leave_page?http%3A%2F%2Fwiki.openstreetmap.org%2Fwiki%2FPlanet.osm OpenStreetMap]: векторные картографические данные для всей планеты, с бесплатной лицензией. Включает в себя старую версию данных TIGER Бюро переписи США.
== См. также ==