Машинное обучение на мобильных телефонах — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 12: Строка 12:
 
=== Распознавание фото, текста и видео ===
 
=== Распознавание фото, текста и видео ===
  
{main|http://neerc.ifmo.ru/wiki/index.php?title=%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B8}
+
''Основная статья: [http://neerc.ifmo.ru/wiki/index.php?title=%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0_%D0%BD%D0%B0_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B8 Распознавание текста]''.
Распознавание фото и видео на мобильных телефонах мало чем отличается от обычных компьютерных методов, только цели немного другие.
+
 
 +
''Основная статья: [http://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B5_%D0%B7%D1%80%D0%B5%D0%BD%D0%B8%D0%B5 Компьютерное зрение]''.
 +
 
 +
Распознавание фото и видео на мобильных телефонах мало чем отличается от обычных компьютерных методов, только цели немного другие. Например, некоторые мобильные телефоны используют Face ID, которое узнает владельца через фронтальную камеру. Есть приложения для определения возраста, пола.
 +
 
 +
Если же рассмотреть распознавание текста, то и у него тоже есть большое количество применений {{---}} сканирование чеков, кредитные карты, документы, переводить в реальном времени иностранные слова.
  
 
Существует несколько известных библиотек для работы с изображениями на мобильных приложениях: [https://github.com/tesseract-ocr/tesseract Tesseract], [https://opencv.org/ OpenCV], [https://developers.google.com/vision Mobile Vision Google], [https://developers.google.com/ml-kit ML Kit]. Изображения легко передавать через сеть, так что можно обрабатывать их и на веб-серверах.
 
Существует несколько известных библиотек для работы с изображениями на мобильных приложениях: [https://github.com/tesseract-ocr/tesseract Tesseract], [https://opencv.org/ OpenCV], [https://developers.google.com/vision Mobile Vision Google], [https://developers.google.com/ml-kit ML Kit]. Изображения легко передавать через сеть, так что можно обрабатывать их и на веб-серверах.
Строка 19: Строка 24:
 
=== Распознавание звука ===
 
=== Распознавание звука ===
  
Распознавание звука и его парсинг тоже очень важная задача машинного обучения. Голосовые помощники, голосовой ввод, умные дома {{---}} все это нужно для нашей жизни.  
+
''Основная статья: [http://neerc.ifmo.ru/wiki/index.php?title=%D0%A0%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%80%D0%B5%D1%87%D0%B8 Распознавание речи]''.
 +
 
 +
Распознавание звука и его парсинг тоже очень важная задача машинного обучения. Голосовые помощники, голосовой ввод, умные дома {{---}} все это нужно для нашей жизни.
 +
 
 +
Для распознавания речи есть библиотека [https://github.com/cmusphinx/pocketsphinx pocketsphinx]
  
 
=== Анализ данных с сенсоров ===
 
=== Анализ данных с сенсоров ===
 +
 +
{|align="center"
 +
|-valign="top"
 +
|[[Файл:ML_Mobile_Phone_Sensors.png|800px|мини|Применение различных сенсоров [https://www.osp.ru/os/2017/03/13052701 Источник]]]
 +
|}
 +
  
 
=== Навигация ===
 
=== Навигация ===
Строка 48: Строка 63:
 
# [https://habr.com/ru/company/mobileup/blog/332500/ habr.com] - краткий обзор и пример на CoreML.
 
# [https://habr.com/ru/company/mobileup/blog/332500/ habr.com] - краткий обзор и пример на CoreML.
 
# [https://habr.com/ru/post/345268/ habr.com] - распознавание изображений.
 
# [https://habr.com/ru/post/345268/ habr.com] - распознавание изображений.
# [https://habr.com/ru/company/yoomoney/blog/461867/ habr.com] - использование ML Kit
+
# [https://habr.com/ru/company/yoomoney/blog/461867/ habr.com] - использование ML Kit.
 +
№ [https://habr.com/ru/post/237589/ habr.com] - использование Pocketsphinx.
  
  
 
[[Категория: Машинное обучение]] [[Категория: Мобильная разработка]]
 
[[Категория: Машинное обучение]] [[Категория: Мобильная разработка]]

Версия 15:45, 5 января 2021

Задача Машинного обучения на мобильных телефонах — очень популярная область машинного обучения. Огромное количество мобильных приложений каким либо образом используют машинное обучение.

Соцсети, редакторы фото и видео, карты, игры и даже ваш плеер — все это использует машинное обучение.


Задачи машинного обучения на телефонах

Кастомизация

Конечно же, самое первое, что может прийти в голову про применения машинного обучения на телефонах — это кастомизация. Подбор музыки, новостей, любого контента — все это достигается путем обучения машинного обучения. Приложение получает ваши персональные данные и, используя данные старых пользователей, показывает вам то, что понравилось людям с наиболее подходящими данными. Однако такая работа связана с очень большими вычислениями, и, чаще всего, выполняется на сторонних серверах. Самая частая модель для классификации изображений - CNN, однако часто даже такая классификация является излишней.

Распознавание фото, текста и видео

Основная статья: Распознавание текста.

Основная статья: Компьютерное зрение.

Распознавание фото и видео на мобильных телефонах мало чем отличается от обычных компьютерных методов, только цели немного другие. Например, некоторые мобильные телефоны используют Face ID, которое узнает владельца через фронтальную камеру. Есть приложения для определения возраста, пола.

Если же рассмотреть распознавание текста, то и у него тоже есть большое количество применений — сканирование чеков, кредитные карты, документы, переводить в реальном времени иностранные слова.

Существует несколько известных библиотек для работы с изображениями на мобильных приложениях: Tesseract, OpenCV, Mobile Vision Google, ML Kit. Изображения легко передавать через сеть, так что можно обрабатывать их и на веб-серверах.

Распознавание звука

Основная статья: Распознавание речи.

Распознавание звука и его парсинг тоже очень важная задача машинного обучения. Голосовые помощники, голосовой ввод, умные дома — все это нужно для нашей жизни.

Для распознавания речи есть библиотека pocketsphinx

Анализ данных с сенсоров

Применение различных сенсоров Источник


Навигация

Процессоры

Из-за медлительности телефонов развитие машинного обучения на телефонах началось совсем недавно. Раньше все данные хранились на серверах компаний, выбор модели был очень широк, и, с точки зрения безопасности, это было плохо. Однако теперь IT-гиганты, такие, как Google, переходят на модель федеративное обучение. Понятно, что обычный телефон не может себе позволить обучаться на тяжелых моделях, таких как, например, нейронные сети. Однако существуют модели, которые потребляют очень малое количество памяти и времени на обучение. В основном именно они используются, когда нет соединения с сервером.

Однако машинное обучение стало настолько актуальным, что производители процессоров задумались о том, что бы создавать процессоры, некоторые чипы которых заточены под задачи машинного обучения.

Примерами являются такие процессоры как:

Существует огромное число процессоров для огромного числа задач, начиная от задачи линейной регрессии до задач глубокого обучения.


Источники информации

  1. azoft.ru - о применении машинного обучения.
  2. habr.com - железо и процессоры.
  3. habr.com - краткий обзор и пример на CoreML.
  4. habr.com - распознавание изображений.
  5. habr.com - использование ML Kit.

habr.com - использование Pocketsphinx.