Изменения

Обучение на больших данных

118 байт добавлено, 10:08, 19 января 2021

→‎Обработка разнородных данных в рамках одной системы

* <tex>\{SS\}_{j=1}^{m_{ss}}</tex> {{---}} методы разбиения разнородных данных;

* <tex>\{E\}_{k=1}^{p_e}</tex> {{---}} множество исполнителей задач сбора данных;

* <tex>n_{st}</tex> {{---}} – количество шаблонов данных;

* <tex>m_{ss}</tex> {{---}} количество типов данных;

* <tex>IS</tex> {{---}} метод индексирования данных в хранилище озера данных;

* <tex>DS</tex> {{---}} – структура озера разнородных данных.

Данная модель позволяет хранить как сырые разнородные данные, так и структурированные данные в соответствии с предопределенной схемой. Такой результат достигается наличием шаблонов объектов и шаблонов параметров объектов. Также это позволяет снизить временные затраты на доступ к данным.

Рассмотрим схему модели:

* '''~~Object~~ Parameter template''' {{---}} шаблон ~~некоторого объекта <tex>O</tex>. Каждый объект может иметь множество источников~~ параметра, хранимого в источнике данных ~~<tex>M_{ds}</tex>. Структуру объекта можно представить следующим образом:<tex>O=\langle ds_1, ds_2, \dots, ds_m \rangle</tex>~~;

* '''Object template''' {{---}} шаблон некоторого объекта <tex>O</tex>. Каждый объект может иметь множество источников данных <tex>M_{ds}</tex>. Структуру объекта можно представить следующим образом: <tex>O=\langle ds_1, ds_2, \dots, ds_m \rangle</tex>; * '''Data source template''' {{---}} шаблон источника данных. Каждый источник данных может иметь множество параметров с различными типами данных <tex>M_p</tex>. Структуру источника данных можно представить следующим образом:<tex>ds=\langle p_1, p_2, \dots, p_k \rangle</tex>.

== Практическое применение Big Data ==

Анонимный участник

2.63.101.188

Изменения

Обучение на больших данных

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты