Изменения

Перейти к: навигация, поиск

Обучение на больших данных

118 байт добавлено, 10:08, 19 января 2021
Обработка разнородных данных в рамках одной системы
* <tex>\{SS\}_{j=1}^{m_{ss}}</tex> {{---}} методы разбиения разнородных данных;
* <tex>\{E\}_{k=1}^{p_e}</tex> {{---}} множество исполнителей задач сбора данных;
* <tex>n_{st}</tex> {{---}} количество шаблонов данных;
* <tex>m_{ss}</tex> {{---}} количество типов данных;
* <tex>IS</tex> {{---}} метод индексирования данных в хранилище озера данных;
* <tex>DS</tex> {{---}} структура озера разнородных данных.
Данная модель позволяет хранить как сырые разнородные данные, так и структурированные данные в соответствии с предопределенной схемой. Такой результат достигается наличием шаблонов объектов и шаблонов параметров объектов. Также это позволяет снизить временные затраты на доступ к данным.
Рассмотрим схему модели:
* '''Object Parameter template''' {{---}} шаблон некоторого объекта <tex>O</tex>. Каждый объект может иметь множество источников параметра, хранимого в источнике данных <tex>M_{ds}</tex>. Структуру объекта можно представить следующим образом:<tex>O=\langle ds_1, ds_2, \dots, ds_m \rangle</tex>;
* '''Object template''' {{---}} шаблон некоторого объекта <tex>O</tex>. Каждый объект может иметь множество источников данных <tex>M_{ds}</tex>. Структуру объекта можно представить следующим образом: <tex>O=\langle ds_1, ds_2, \dots, ds_m \rangle</tex>; * '''Data source template''' {{---}} шаблон источника данных. Каждый источник данных может иметь множество параметров с различными типами данных <tex>M_p</tex>. Структуру источника данных можно представить следующим образом:<tex>ds=\langle p_1, p_2, \dots, p_k \rangle</tex>.
== Практическое применение Big Data ==
Анонимный участник

Навигация