Изменения

Обзор библиотек для машинного обучения на Python

27 693 байта убрано, 17:18, 8 апреля 2019

Нет описания правки

[[File:~~python-logo~~Java.~~png~~jpeg|auto|thumb|~~Python~~Java: https://www.~~python~~oracle.~~org~~com/java/]] ==~~Scikit-learn~~Популярные библиотеки==~~===Описание===Scikit-learn~~* <code>Weka</code><ref>[https://~~scikit-learn~~www.cs.waikato.ac.~~org~~nz/~ml/~~stable~~weka/ ~~Библиотека scikit-learn~~Weka]</ref> {{---}} популярная библиотека ~~машинного обучения~~ , написанная на языке программирования Python с открытым исходным кодом. Содержит реализации практически всех возможных преобразований, <code>Java</code> и ~~нередко ее одной хватает~~ содержащая в себе множество алгоритмов машинного обучения для ~~полной реализации модели~~задач анализа данных. ~~В данной библиотеки реализованы методы разбиения датасета на тестовый и обучающий~~Предоставляет инструменты для решения задач классификации, ~~вычисление основных метрик над наборами~~ кластеризации данных, ~~проведение [[кросс-валидации|Кросс-валидация]]~~регрессионного анализа и др.* <code>Smile</code><~~sup~~ref>[~~на 28~~https://haifengl.01github.~~19 не создан~~io/smile/ Smile, Statistical Machine Intelligence and Learning Engine]</~~sup~~ref>~~. В библиотеке также есть основные алгоритмы машинного обучения: [[Линейная регрессия|линейной регрессии]]~~{{---}} <~~sup~~code>~~[на 28.01.19 не создан]~~Java</~~sup~~code> ~~и её модификаций Лассо~~фреймворк для машинного обучения, ~~гребневой регрессии~~анализа естественного языка, ~~[[Метод опорных векторов (SVM)|опорных векторов]]~~линейной алгебры и визуализации данных. <~~sup~~code>~~[на 28.01.19 не создан]~~Smile</~~sup~~code>~~, [[Дерево решений~~ покрывает все основные аспекты машинного обучения и ~~случайный лес|решающих деревьев~~ предоставляет высокопроизводительные алгоритмы и ~~лесов]] и др~~структуры данных. Есть и реализации основных методов [[Кластеризация|кластеризации]]. Кроме того, библиотека содержит постоянно используемые исследователями методы работы с признаками: например, понижение размерности [[Метод главных компонент (PCA)|методом главных компонент]]* <~~sup~~code>~~[на 28.01.19 не создан]~~deeplearning4j</~~sup~~code>~~. Частью пакета является библиотека imblearn~~<ref>[https://~~imbalanced-learn.readthedocs~~github.iocom/endeeplearning4j/~~stable~~deeplearning4j deeplearning4j, deep learning & linear algebra for Java/~~index.html Библиотека imbalanced-learn~~Scala with GPUs + Spark]</ref>{{---}} <code>Java</code> библиотека для глубокого обучения, ~~позволяющая работать~~ создания рекуррентых (в том числе распределенных) нейронных сетей.==Примеры кода==Для работы с ~~разбалансированными выборками~~ приведенными ниже примерами необходим <code>JDK</code> версии не ниже 10 и ~~генерировать новые значения~~система сборки <code>Maven</code>. Каждый пример структурирован следующим образом: # <code>Maven</code> зависимость на необходимые библиотеки# Список необходимых <code>import</code> директив# Код примера с комментариями===~~Примеры кода~~Вариации регрессии==={{main|Вариации регрессии}}

====Линейная регрессия====

{{~~Main~~main|Линейная регрессия~~|l1=Линейная регрессия[на 28.01.19 не создан]~~}} Пример линейной регресии с применением <~~font color="green"~~code>~~# Add required imports~~ ~~'''import''' matplotlib~~weka.classifiers.~~pyplot '''as''' plt~~ ~~'''import''' numpy '''as''' np~~ ~~'''from''' sklearn '''import''' datasets~~ ~~'''from''' sklearn~~functions.~~linear_model '''import'''~~ LinearRegression ~~'''from''' sklearn.metrics '''import''' mean_squared_error, r2_score~~ ~~Загрузка датасета:~~ ~~diabetes = datasets.load_diabetes()~~ ~~# Use only one feature~~ ~~diabetes_X = diabetes.data[:, np.newaxis, 2]~~ ~~Разбиение датасета на тренировочный и тестовый:~~ ~~# Split the data into training/testing sets~~</~~font~~code> ~~x_train = diabetes_X[:-20~~<~~/font~~ref>] ~~x_test = diabetes_X~~[~~-20~~http:] ~~# Split the targets into training~~/~~testing sets<~~/~~font>~~ ~~y_train = diabetes~~weka.~~target[:-20]~~ ~~y_test = diabetes~~sourceforge.~~target[-20<~~net/~~font>:]~~ ~~Построение и обучение модели:~~ ~~lr = LinearRegression()~~ ~~lr.fit(x_train, y_train)~~ ~~predictions = lr~~doc.~~predict(x_test)~~ ~~Оценка алгоритма:~~ ~~# The mean squared error<~~dev/~~font>~~ ~~print("Mean squared error: %.2f"<~~weka/~~font>~~ ~~% mean_squared_error(y_test, predictions))~~ ~~# Explained variance score: 1 is perfect prediction<~~classifiers/~~font>~~ ~~print('Variance score: %.2f'<~~functions/~~font> % r2_score(y_test, predictions))~~ ~~> '''Mean squared error: 2548~~LinearRegression.~~07'''~~ ~~'''Variance score: 0.47'''~~ ~~Построение графика прямой, получившейся в результате работы линейной регрессии:~~ ~~plt.scatter(x_test, y_test, color='black'<~~html/~~font>)~~ ~~plt.plot(x_test~~Weka, ~~predictions, color='blue'~~Linear Regression]</~~font~~ref>~~, linewidth=3)~~ ~~plt.xticks(())~~ ~~plt.yticks(())~~ ~~plt.show()~~ ~~[[File:Diabetes-sklearn.png|400px|none|super]]~~

~~====Логистическая регрессия====~~ <dependency>~~{{Main|Логистическая регрессия}}~~ <groupId>nz.ac.waikato.cms.weka</groupId> <artifactId>weka-stable</artifactId> <version>3.8.0</version> </dependency>

~~Загрузка датасета:~~ '''~~from~~import''' ~~sklearn~~weka.~~datasets~~ classifiers.functions.LinearRegression; '''import''' ~~load_digits~~weka.core.Instance; ~~digits = load_digits()~~'''import''' weka.core.Instances;

~~Вывод первых трех тренировочных данных для визуализации:~~ ~~'''import''' numpy '''as''' np~~//Load Data set '''~~import~~var''' ~~matplotlib~~data = new Instances(new BufferedReader(new FileReader("dataset/house.~~pyplot '''as''' plt~~arff"))); ~~plt~~data.~~figure~~setClassIndex(~~figsize=~~data.numAttributes() - 1); 20//Build model~~,4)~~new LinearRegression(); '''~~for~~try''' ~~index,~~ { model.buildClassifier(~~image, label~~data) ; } '''incatch''' ~~enumerate~~(~~zip~~Exception e) { e.printStackTrace(~~digits.data[~~); } 0//output model System.out.printf("model parameters:~~3]~~, ~~digits.target[~~model); 0// Now Predicting the cost~~:3]~~data.lastInstance(); '''var''' price = model.classifyInstance(myHouse):; ~~plt~~ System.~~subplot~~out.printf(~~1~~, ~~3, index + 1~~{{main|Логистическая регрессия}}Пример линейной регрессии с применением <~~/font~~code>) ~~plt~~smile.~~imshow(np~~classification.~~reshape(image, (8~~LogisticRegression</~~font~~code>,<~~font color="blue"~~ref>8<[https://~~font>)), cmap=plt~~haifengl.cmgithub.~~gray)~~ ~~plt.title('Training: %i\n'<~~io/smile/api/java/smile/classification/LogisticRegression/~~font> % label~~Smile, ~~fontsize = 20~~Logistic Regression]</~~font~~ref>)

~~[[File:Digits~~ <dependency> <groupId>com.github.haifengl</groupId> <artifactId>smile-~~sklearn~~core</artifactId> <version>1.5.~~png|800px|none|super]]~~2</version> </dependency>

~~Разбиение датасета на тренировочный и тестовый:~~ '''import''' smile.data.AttributeDataset; '''~~from~~import''' ~~sklearn~~smile.~~model_selection~~ data.NominalAttribute; '''import''' ~~train_test_split~~smile.classification.LogisticRegression; ~~x_train, x_test, y_train, y_test = train_test_split(digits~~'''import''' smile.data~~, digits~~.~~target, test_size=0~~parser.~~25, random_state=0)~~ArffParser;

~~Построение и обучение модели:~~ '''~~from~~var''' ~~sklearn~~arffParser = new ArffParser(); arffParser.~~linear_model~~ setResponseIndex(4); '''~~import~~var''' ~~LogisticRegression~~iris lr = ~~LogisticRegression~~arffParser.parse(smile.data.parser.IOUtils.getTestDataFile("weka/iris.arff")); lr'''var''' logClf = new LogisticRegression(iris.~~fit~~x(~~x_train~~), ~~y_train~~iris.labels()); ~~predictions = lr~~logClf.predict(~~x_test~~testX);====Гребневая регрессия (ридж-регрессия)===={{Main|Вариации регрессии#Гребневая регрессия (ридж-регрессия)}}

~~Оценка алгоритма:~~ ~~score = lr~~Пример гребневой регрессии с применением <code>smile.regression.~~score(x_test, y_test)~~ ~~print(~~RidgeRegression</code><~~font color="red"~~ref>~~"Score~~[https: %//haifengl.github.io/smile/api/java/smile/regression/RidgeRegression.~~3f"~~html/ Smile, Ridge Regression]</~~font~~ref> ~~% score)~~

<dependency> ~~'''Score: 0~~ <groupId>com.github.haifengl</groupId> <artifactId>smile-core</artifactId> <version>1.~~953'''~~5.2</version> </dependency>

~~====Перцептрон====~~ '''import''' smile.data.NominalAttribute;~~{{Main|Нейронные сети, перцептрон}}~~ '''import''' smile.data.parser.DelimitedTextParser; '''import''' smile.regression.RidgeRegression;

~~Загрузка датасета:~~ '''var''' parser = new DelimitedTextParser(); parser.setDelimiter(", "); parser.setResponseIndex(new NominalAttribute("class"), 0); '''~~from~~var''' ~~sklearn~~ dataset = parser.parse("dataset.csv"); '''~~import~~var''' ~~datasets~~lambda = 0.0057d; ~~iris~~ '''var''' ridgeClf = ~~datasets~~new RidgeRegression(dataset.~~load_iris~~x(), dataset.y(), lambda); ~~X = iris~~ridgeClf.~~data~~predict(testX); y = ~~iris.target~~===Лассо-регрессия===={{Main|Вариации регрессии#Лассо-регрессия}}

~~Разбиение датасета на тренировочный и тестовый:~~ ~~'''from''' sklearn~~Пример Лассо-регрессии с применением <code>smile.regression.~~model_selection '''import''' train_test_split~~ ~~X_train, X_test, y_train, y_test = train_test_split(X, y, test_size =~~ LASSO</code><~~font color="blue"~~ref>0[https://haifengl.github.io/smile/api/java/smile/regression/LASSO.20html/ Smile, LASSO regression]</~~font~~ref>)

~~Трансформация признаков:~~ <dependency> ~~'''from''' sklearn~~ <groupId>com.github.~~preprocessing '''import''' StandardScaler~~haifengl</groupId> ~~scaler = StandardScaler()~~ <artifactId>smile-core</artifactId> ~~scaler~~ <version>1.~~fit(X_train)~~ ~~X_train = scaler~~5.~~transform(X_train)~~2</version> ~~X_test = scaler.transform(X_test)~~</dependency>

~~Построение и обучение модели:~~ '''~~from~~import''' ~~sklearn~~smile.~~neural_network~~ data.NominalAttribute; '''import''' ~~MLPClassifier~~ ~~mlp = MLPClassifier(hidden_layer_sizes=(10, 10, 10), max_iter=1000)~~ ~~mlp~~smile.~~fit(X_train, y_train~~data.~~values~~parser.~~ravel())~~DelimitedTextParser; ~~predictions = mlp~~'''import''' smile.regression.~~predict(X_test)~~LASSO;

~~Оценка алгоритма:~~ '''var''' parser = new DelimitedTextParser(); parser.setDelimiter(", "); parser.setResponseIndex(new NominalAttribute("class"), 0); '''~~from~~var''' ~~sklearn~~dataset = parser.parse("dataset.~~metrics~~ csv"); '''~~import~~var''' ~~classification_report, confusion_matrix~~lasso ~~print~~= new LASSO(~~confusion_matrix~~dataset.x(~~y_test~~),~~predictions~~dataset.y(), 10); ~~print~~lasso.predict(~~classification_report(y_test~~testX);===Классификация при помощи MLP==={{main|Нейронные сети, перцептрон}}Пример классификации с применением <code>weka.classifiers.functions.MultilayerPerceptron</code><ref>[http://weka.sourceforge.net/doc.dev/weka/classifiers/functions/MultilayerPerceptron.html/ Weka,~~predictions))~~MLP]</ref>

<dependency> ~~'''[[ 7 0 0]'''~~ ~~'''[ 0 8 1]'''~~ ~~'''[ 0 2 12]]'''~~ ~~'''precision recall f1-score support'''~~ ~~'''0 1~~ <groupId>nz.ac.~~00 1~~waikato.~~00 1~~cms.~~00 7'''~~weka</groupId> ~~'''1 0.80 0.89 0.84 9'''~~ <artifactId>weka-stable</artifactId> ~~'''2 0~~ <version>3.~~92 0~~8.86 0~~.89 14'''~~</version> ~~'''micro avg 0.90 0.90 0.90 30'''~~ ~~'''macro avg 0.91 0.92 0.91 30'''~~ ~~'''weighted avg 0.90 0.90 0.90 30'''~~</dependency>

~~====Метрический классификатор и метод ближайших соседей====~~ '''import''' weka.classifiers.functions.MultilayerPerceptron;{{Main|Метрический классификатор и метод ближайших соседей#Пример использования (через scikit-learn)|l1=Метрический классификатор и метод ближайших соседей: пример через scikit-learn}} '''import''' weka.core.converters.CSVLoader; '''import''' java.io.File;

// read train & test datasets and build MLP classifier '''var''' trainds =new DataSource("etc/train.csv"); '''var''' train =trainds.getDataSet(); train.setClassIndex(train.numAttributes() - 1); '''var''' testds =~~Дерево решений и случайный лес~~new DataSource("etc/test.csv"); '''var''' test =testds.getDataSet(); test.setClassIndex(test.numAttributes() - 1); '''var''' mlp =new MultilayerPerceptron(); mlp.buildClassifier(train); // Test the model '''var''' eTest =new Evaluation(train);~~{{Main|Дерево решений и случайный лес#Примеры использования~~ eTest.evaluateModel(~~в scikit-learn~~mlp, test)~~|l1~~; // Print the result à la Weka explorer: ~~пример через scikit-learn}}~~ '''var''' strSummary = eTest.toSummaryString(); System.out.println(strSummary);

===Рекуррентные нейронные сети=~~Обработка естественного языка~~=={{Main|Рекуррентные нейронные сети}}[https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/recurrent/basic/BasicRNNExample.java Пример] простой рекуррентной нейронной сети, способной генерировать заданную строку по первому символу, с применением библиотеки <code>deeplearning4j</code>.===Долгая краткосрочная память==={{Main|~~Обработка естественного языка~~Долгая краткосрочная память}}[https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/recurrent/character/LSTMCharModellingExample.java Пример] реализации рекуррентной нейронной сети, использующей механизм LSTM и натренированной на текстах Шекспира, с применением библиотеки <code>deeplearning4j</code>.===Метод опорных векторов==={{main|Метод опорных векторов (SVM)}}Пример классификации с применением <code>smile.classification.SVM</code><ref>[https://haifengl.github.io/smile/api/java/smile/classification/SVM.html/ Smile, SVM]</ref>

~~Загрузка датасета:~~ <dependency> ~~'''from''' sklearn '''import''' fetch_20newsgroups~~ <groupId>com.github.haifengl</groupId> ~~twenty_train = fetch_20newsgroups(subset=~~ <~~font color="red"~~artifactId>~~'train'~~smile-core</~~font~~artifactId> <version>~~, shuffle='''True''', random_state=~~1.5.2<~~font color="blue"~~/version>42 </~~font~~dependency>)

~~Вывод первых трех строк первого тренивочного файла и его класса:~~ '''import''' smile.classification.SVM; ~~print("\n"~~'''import''' smile.~~join(twenty_train~~data.NominalAttribute; '''import''' smile.data~~[0]~~.~~split("\n")[:3]))~~parser.DelimitedTextParser; '''import''' smile.math.kernel.GaussianKernel; ~~print(twenty_train~~'''import''' java.~~target_names[twenty_train~~util.~~target[0]])~~Arrays;

~~> '''From: lerxst@wam.umd.edu (where's my thing)'''~~ ~~'''Subject: WHAT car is this!?'''~~ ~~'''Nntp-Posting-Host: rac3.wam.umd.edu'''~~ ~~'''rec.autos'''~~ Построение и обучение двух моделей. Первая на основе [[Байесовская классификация | Байесовской классификации]]<~~sup~~font color="green">~~[на 28.01.19 не создан]~~// read train & test dataset</~~sup~~font>~~, а вторая использует метод опорных векторов:~~ '''~~from~~var''' ~~sklearn.pipeline '''import''' Pipeline~~parser = new DelimitedTextParser(); ~~'''from''' sklearn~~parser.~~feature_extraction.text '''import''' CountVectorizer~~setResponseIndex(new NominalAttribute("class"), ~~TfidfTransformer~~ 0); '''~~from''' sklearn.naive_bayes '~~var''~~import~~'~~'' MultinomialNB~~train ~~text_clf1~~ = ~~Pipeline([~~ parser.parse(~~'vect'~~, ~~CountVectorizer~~this.getClass()), .getResourceAsStream(~~'tfidf'<~~/~~font>, TfidfTransformer()),~~ ~~('clf', MultinomialNB(~~)), ]) ; '''~~from~~var''' ~~sklearn~~test = parser.~~linear_model '''import''' SGDClassifier~~ ~~text_clf2 = Pipeline~~parse([ ~~('vect'~~, ~~CountVectorizer~~this.getClass()), .getResourceAsStream(~~'tfidf'<~~/~~font>, TfidfTransformer()),~~ ~~('clf'<~~smile/~~font>, SGDClassifier(loss='hinge'<~~data/~~font>, penalty='l2'<~~usps/~~font>,~~ ~~alpha=1e-3, random_state=42,~~)); ~~max_iter=5, tol=~~ '''~~None~~var'''classes = Arrays.stream(test.labels()), ]) ~~text_clf1~~.~~fit~~max(~~twenty_train.data, twenty_train.target~~) ~~text_clf2~~.~~fit~~orElse(~~twenty_train.data, twenty_train.target~~0) ~~Оценка алгоритмов:~~+ 1; ~~twenty_test = fetch_20newsgroups(subset=~~~~'test'~~// build SVM classifier~~, shuffle=~~ '''~~True~~var'''~~, random_state~~svm =new SVM<~~font color="blue">42</font~~>(new GaussianKernel(8.0), 5.0, classes, SVM.Multiclass.ONE_VS_ONE); ~~docs_test = twenty_test~~svm.~~data~~ ~~predicted1 = text_clf1~~learn(train.~~predict~~x(~~docs_test~~) ~~predicted2 = text_clf2~~, train.~~predict~~labels(~~docs_test~~)); ~~print("Score: %.3f" % np~~svm.~~mean~~finish(~~predicted1 == twenty_test.target)~~); ~~print(~~~~"Score: %.3f"~~// calculate test error rate ~~% np.mean(predicted2 == twenty_test.target))~~ > '''~~Score for naive Bayes: 0.774~~var'''error = 0; ~~'''Score~~ for ~~SVM:~~ (int i = 0; i < test.x().~~824'''~~ ~~====Кросс-валилация и подбор параметров====~~length; i++) {~~{Main|Кросс-валидация}}~~ Возьмем предыдущий пример с обработкой естественного языка и попробуем увеличить точность алгоритма за счет кросс-валидации и подбора параметров: ~~'''from''' sklearn~~ if (svm.~~model_selection '''import''' GridSearchCV~~ ~~parameters = {~~ ~~'vect__ngram_range': [~~predict(~~1, 1),~~ test.x(~~1, 2~~)[i], ~~'tfidf__use_idf':~~ test.labels(~~'''True''', '''False'''~~),[i]) { error++; ~~'clf__alpha': (1e-2, 1e-3),~~ }

}

~~gs_clf = GridSearchCV(text_clf2, parameters, cv=5, iid='''False''', n_jobs=-1)~~ ~~gs_clf = gs_clf~~System.~~fit(twenty_train~~out.~~data, twenty_train.target)~~ ~~print~~format(~~"Best score:~~ %.~~3f"~~ 2f% ~~gs_clf.best_score_)~~ ~~'''for''' param_name '''in''' sorted(parameters.keys()):~~ ~~print("%s:~~ %r\n"~~ % (param_name~~, ~~gs_clf~~100.~~best_params_[param_name]))~~ ~~> '''Best score: 0.904'''~~ ~~'''clf__alpha:~~ 0* error / test.~~001'''~~ ~~'''tfidf__use_idf: True'''~~ ~~'''vect__ngram_range:~~ x(~~1, 2~~)~~'''~~ ~~====Метод опорных векторов (SVM~~.length)~~===={{Main|Метод опорных векторов (SVM)|l1=Метод опорных векторов (SVM) [на 28.01.19 не создан]}}~~;

~~Загрузка датасета:~~ ~~'''from''' sklearn '''import''' datasets~~===Деревья решений, случайный лес=== ~~iris = datasets.load_iris()~~{{Main|Дерево решений и случайный лес#Пример на языке Java}}

~~Разбиение датасета на тестовый и тренировочный:~~ ~~'''from''' sklearn.model_selection '''import''' train_test_split~~ ~~x_train, x_test, y_train, y_test~~ = ~~train_test_split(iris.data, iris.target, test_size~~=~~0.25~~Бустинг, ~~random_state~~Ada-boost==~~0)~~{{main|Бустинг, AdaBoost#Пример на языке Java}}

~~Построение и обучение модели:~~===EM-алгоритм=== ~~clf~~ {{Main|EM-алгоритм|ll= ~~svm~~EM-алгоритм [на 08.04.~~SVC(kernel=~~19 не создан]}}Пример кластеризации с применением <~~font color="red"~~code>~~'linear'~~weka.clusterers.EM</~~font~~code><ref>[http://weka.sourceforge.net/doc.dev/weka/clusterers/EM.html/ Weka, C=EM]</ref> <dependency> <~~font color="blue"~~groupId>1nz.ac.waikato.cms.0weka</groupId> <artifactId>weka-stable</~~font~~artifactId>) ~~clf~~ <version>3.8.~~fit(x_train, y_train)~~0</version> ~~predictions = clf.predict(x_test)~~</dependency>

~~Оценка алгоритма:~~ '''import''' weka.clusterers.ClusterEvaluation; '''~~from~~import''' ~~sklearn~~weka.~~metrics~~ clusterers.EM; '''import''' ~~classification_report, confusion_matrix~~weka.core.Instances; ~~print(confusion_matrix(y_test,predictions))~~'''import''' java.io.BufferedReader; '''import''' java.io.FileReader; ~~print(classification_report(y_test,predictions))~~'''import''' java.util.Random;

//load data ~~'''[[13 0 0]'''~~ '''~~[ 0 15 1]'''~~ ~~'''[ 0 0 9]]~~var'''data = new Instances(new BufferedReader(new FileReader("data/bank-data.arff"))); ~~'''precision recall f1-score~~ ~~support'''~~// new instance of clusterer '''~~0 1.00 1.00 1.00 13~~var'''model = new EM(); ~~'''1 1.00 0.94 0.97 16'''~~ // build the clusterer ~~'''2 0.90 1.00 0~~ model.~~95 9'''~~buildClusterer(data); ~~'''micro avg 0~~System.~~97 0~~out.~~97 0.97 38'''~~println(model); ~~'''macro avg 0.97 0.98 0.97 38~~ ''' var'''~~weighted avg 0~~logLikelihood = ClusterEvaluation.~~98 0.97 0.97 38'''~~crossValidateModel(model, data, 10, new Random(1));

===~~=EM-алгоритм=~~Уменьшение размерности==={{Main|~~EM-алгоритм|l1=EM-алгоритм[~~Уменьшение размерности#Пример на ~~28.01.19 не создан]~~языке Java}}

~~'''import''' numpy '''as''' np~~ ~~'''import''' matplotlib.pyplot '''as''' plt~~ ~~'''from''' matplotlib.colors '''import''' LogNorm~~ ~~'''from''' sklearn '''import''' mixture~~ ~~n_samples = 300~~ ~~# generate random sample, two components~~ ~~np.random.seed(0)~~ ~~# generate spherical data centered on (20, 20)~~ ~~shifted_gaussian~~ = ~~np.random.randn(n_samples, 2) + np.array([20, 20])~~ ~~~~{{Main|Байесовская классификация# ~~generate zero centered stretched Gaussian data~~ ~~C = np.array([[0., -0.7], [3.5, .7]])~~ ~~stretched_gaussian = np.dot(np.random.randn(n_samples, 2), C)~~ ~~# concatenate the two datasets into the final training set~~ ~~X_train = np.vstack([shifted_gaussian, stretched_gaussian])~~ ~~# fit a Gaussian Mixture Model with two components~~ ~~clf = mixture.GaussianMixture(n_components=2, covariance_type='full')~~ ~~clf.fit(X_train)~~ ~~# display predicted scores by the model as a contour plot~~ ~~x = np.linspace(-20., 30.)~~ ~~y = np.linspace(-20., 40.)~~ ~~X, Y = np.meshgrid(x, y)~~ ~~XX = np.array([X.ravel(), Y.ravel()]).T~~ ~~Z = -clf.score_samples(XX)~~ ~~Z = Z.reshape(X.shape)~~ ~~CS = plt.contour(X, Y, Z, norm=LogNorm(vmin=1.0, vmax=1000.0),~~ ~~levels=np.logspace(0, 3, 10))~~ ~~CB = plt.colorbar(CS, shrink=0.8, extend='both')~~ ~~plt.scatter(X_train[:, 0], X_train[:, 1], .8)~~ ~~plt.title('Negative log-likelihood predicted by a GMM')~~ ~~plt.axis('tight')~~ ~~plt.show()~~Пример на языке Java}}

~~[[File:Em.png|400px|none|super]]~~ ===~~=Уменьшение размерности=~~Метрический классификатор и метод ближайших соседей==={{Main|~~Уменьшение размерности~~Метрический классификатор и метод ближайших соседей#Пример ~~кода scikit-learn|l1=Уменьшение размерности: пример через scikit-learn}}~~ ~~==Tensorflow=====Описание===~~Tensorflow<ref>[https://www.tensorflow.org Библиотека Tensorflow]</ref> {{---}} библиотека, разработанная корпорацией Google для работы с тензорами, используется для построения нейронных сетей. Поддержка вычислений на видеокартах имеет поддержку языка программирования C++. На основе данной библиотеки строятся более высокоуровневые библиотеки для работы с нейронными сетями на уровне целых слоев. Так, некоторое время назад популярная библиотека Keras стала использовать Tensorflow как основной бэкенд для вычислений вместо аналогичной библиотеки Theano. Для работы на видеокартах NVIDIA используется библиотека cuDNN. Если вы работаете с картинками (со сверточными нейросетями), скорее всего, придется использовать данную библиотеку.~~===Примеры кода=======Сверточная нейронная сеть===={{Main|Сверточные нейронные сети}}~~ ~~Реализация сверточной нейронной сети для классификации цифр из датасета MNIST:~~ ~~'''from''' __future__ '''import''' division, print_function, absolute_import~~ ~~'''import''' tensorflow '''as''' tf~~ ~~# Import MNIST data~~ ~~'''from''' tensorflow.examples.tutorials.mnist '''import''' input_data~~ ~~mnist = input_data.read_data_sets("/tmp/data/", one_hot='''True''')~~ ~~# Training Parameters~~ ~~learning_rate = 0.001~~ ~~num_steps = 200~~ ~~batch_size = 128~~ ~~display_step = 10~~ ~~# Network Parameters~~ ~~num_input = 784 # MNIST data input (img shape: 28*28)~~ ~~num_classes = 10 # MNIST total classes (0-9 digits)~~ ~~dropout = 0.75 # Dropout, probability to keep units~~ ~~# tf Graph input~~ ~~X = tf.placeholder(tf.float32, ['''None''', num_input])~~ ~~Y = tf.placeholder(tf.float32, ['''None''', num_classes])~~ ~~keep_prob = tf.placeholder(tf.float32) # dropout (keep probability)~~ ~~# Create some wrappers for simplicity~~ ~~'''def''' conv2d(x, W, b, strides=1):~~ ~~# Conv2D wrapper, with bias and relu activation~~ ~~x = tf.nn.conv2d(x, W, strides=[1, strides, strides, 1], padding='SAME')~~ ~~x = tf.nn.bias_add(x, b)~~ ~~'''return''' tf.nn.relu(x)~~ ~~'''def''' maxpool2d(x, k=2):~~ ~~# MaxPool2D wrapper~~ ~~'''return''' tf.nn.max_pool(x, ksize=[1, k, k, 1], strides=[1, k, k, 1],~~ ~~padding='SAME')~~ ~~# Create model~~ ~~'''def''' conv_net(x, weights, biases, dropout):~~ ~~# MNIST data input is a 1-D vector of 784 features (28*28 pixels)~~ ~~# Reshape to match picture format [Height x Width x Channel]~~ ~~# Tensor input become 4-D: [Batch Size, Height, Width, Channel]~~ ~~x = tf.reshape(x, shape=[-1, 28, 28, 1])~~ ~~# Convolution Layer~~ ~~conv1 = conv2d(x, weights['wc1'], biases['bc1'])~~ ~~# Max Pooling (down-sampling)~~ ~~conv1 = maxpool2d(conv1, k=2)~~ ~~# Convolution Layer~~ ~~conv2 = conv2d(conv1, weights['wc2'], biases['bc2'])~~ ~~# Max Pooling (down-sampling)~~ ~~conv2 = maxpool2d(conv2, k=2)~~ ~~# Fully connected layer~~ ~~# Reshape conv2 output to fit fully connected layer input~~ ~~fc1 = tf.reshape(conv2, [-1, weights['wd1'].get_shape().as_list()[0]])~~ ~~fc1 = tf.add(tf.matmul(fc1, weights['wd1']), biases['bd1'])~~ ~~fc1 = tf.nn.relu(fc1)~~ ~~# Apply Dropout~~ ~~fc1 = tf.nn.dropout(fc1, dropout)~~ ~~# Output, class prediction~~ ~~out = tf.add(tf.matmul(fc1, weights['out']), biases['out'])~~ ~~'''return''' out~~ ~~# Store layers weight & bias~~ ~~weights = {~~ ~~# 5x5 conv, 1 input, 32 outputs~~ ~~'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32])),~~ ~~# 5x5 conv, 32 inputs, 64 outputs~~ ~~'wc2': tf.Variable(tf.random_normal([5, 5, 32, 64])),~~ ~~# fully connected, 7*7*64 inputs, 1024 outputs~~ ~~'wd1': tf.Variable(tf.random_normal([7*7*64, 1024])),~~ ~~# 1024 inputs, 10 outputs (class prediction)~~ ~~'out': tf.Variable(tf.random_normal([1024, num_classes]))~~ } ~~biases = {~~ ~~'bc1': tf.Variable(tf.random_normal([32])),~~ ~~'bc2': tf.Variable(tf.random_normal([64])),~~ ~~'bd1': tf.Variable(tf.random_normal([1024])),~~ ~~'out': tf.Variable(tf.random_normal([num_classes]))~~ } ~~# Construct model~~ ~~logits = conv_net(X, weights, biases, keep_prob)~~ ~~prediction = tf.nn.softmax(logits)~~ ~~# Define loss and optimizer~~ ~~loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(~~ ~~logits=logits, labels=Y))~~ ~~optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)~~ ~~train_op = optimizer.minimize(loss_op)~~ ~~# Evaluate model~~ ~~correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))~~ ~~accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))~~ ~~# Initialize the variables (i.e. assign their default value)~~ ~~init = tf.global_variables_initializer()~~ ~~# Start training~~ ~~'''with''' tf.Session() '''as''' sess:~~ ~~# Run the initializer~~ ~~sess.run(init)~~ ~~'''for''' step '''in''' '''range'''(1, num_steps+1):~~ ~~batch_x, batch_y = mnist.train.next_batch(batch_size)~~ ~~# Run optimization op (backprop)~~ ~~sess.run(train_op, feed_dict={X: batch_x, Y: batch_y, keep_prob: 0.8})~~ ~~'''if''' step % display_step == 0 '''or''' step == 1:~~ ~~# Calculate batch loss and accuracy~~ ~~loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,~~ ~~Y: batch_y,~~ ~~keep_prob: 1.0})~~ ~~print("Step " + str(step) + ", Minibatch Loss= " + \~~ ~~"{:.4f}".format(loss) + ", Training Accuracy= " + \~~ ~~"{:.3f}".format(acc))~~ ~~print("Optimization Finished!")~~ ~~# Calculate accuracy for 256 MNIST test images~~ ~~print("Testing Accuracy:", \~~ ~~sess.run(accuracy, feed_dict={X: mnist.test.images[:256],~~ ~~Y: mnist.test.labels[:256],~~ ~~keep_prob: 1.0}))~~ ~~> '''Step 1, Minibatch Loss= 41724.0586, Training Accuracy= 0.156'''~~ ~~'''Step 10, Minibatch Loss= 17748.7500, Training Accuracy= 0.242'''~~ ~~'''Step 20, Minibatch Loss= 8307.6162, Training Accuracy= 0.578'''~~ ~~'''Step 30, Minibatch Loss= 3108.5703, Training Accuracy= 0.766'''~~ ~~'''Step 40, Minibatch Loss= 3273.2749, Training Accuracy= 0.727'''~~ ~~'''Step 50, Minibatch Loss= 2754.2861, Training Accuracy= 0.820'''~~ ~~'''Step 60, Minibatch Loss= 2467.7925, Training Accuracy= 0.844'''~~ ~~'''Step 70, Minibatch Loss= 1423.8140, Training Accuracy= 0.914'''~~ ~~'''Step 80, Minibatch Loss= 1651.4656, Training Accuracy= 0.875'''~~ ~~'''Step 90, Minibatch Loss= 2105.9263, Training Accuracy= 0.867'''~~ ~~'''Step 100, Minibatch Loss= 1153.5090, Training Accuracy= 0.867'''~~ ~~'''Step 110, Minibatch Loss= 1751.1400, Training Accuracy= 0.898'''~~ ~~'''Step 120, Minibatch Loss= 1446.2119, Training Accuracy= 0.922'''~~ ~~'''Step 130, Minibatch Loss= 1403.7135, Training Accuracy= 0.859'''~~ ~~'''Step 140, Minibatch Loss= 1089.7897, Training Accuracy= 0.930'''~~ ~~'''Step 150, Minibatch Loss= 1147.0751, Training Accuracy= 0.898'''~~ ~~'''Step 160, Minibatch Loss= 1963.3733, Training Accuracy= 0.883'''~~ ~~'''Step 170, Minibatch Loss= 1544.2725, Training Accuracy= 0.859'''~~ ~~'''Step 180, Minibatch Loss= 977.9219, Training Accuracy= 0.914'''~~ ~~'''Step 190, Minibatch Loss= 857.7977, Training Accuracy= 0.930'''~~ ~~'''Step 200, Minibatch Loss= 430.4735, Training Accuracy= 0.953'''~~ ~~'''Optimization Finished!'''~~ ~~'''Testing Accuracy: 0.94140625'''~~ ~~==Keras=====Описание===~~Keras<ref>[https://keras.io Библиотека Keras]</ref> {{---}} библиотека для построения нейронных сетей, поддерживающая основные виды слоев и структурные элементы. Поддерживает как рекуррентные, так и сверточные нейросети, имеет в своем составе реализацию известных архитектур нейросетей (например, VGG16). Некоторое время назад слои из данной библиотеки стали доступны внутри библиотеки Tensorflow. Существуют готовые функции для работы с изображениями и текстом. Интегрирована в Apache Spark с помощью дистрибутива dist-keras. Данная библиотека позволяет на более высоком уровне работать с нейронными сетями. В качестве библиотеки для бэкенда может использоваться как Tensorflow, так и Theano.~~===Примеры кода=======Сверточная нейронная сеть===={{Main|Сверточные нейронные сети}}~~ ~~Реализация сверточной нейронной сети для классификации текста:~~ ~~'''from''' __future__ '''import''' print_function~~ ~~'''from''' keras.preprocessing '''import''' sequence~~ ~~'''from''' keras.models '''import''' Sequential~~ ~~'''from''' keras.layers '''import''' Dense, Dropout, Activation~~ ~~'''from''' keras.layers '''import''' Embedding~~ ~~'''from''' keras.layers '''import''' Conv1D, GlobalMaxPooling1D~~ ~~'''from''' keras.datasets '''import''' imdb~~ ~~# set parameters:~~ ~~max_features = 5000~~ ~~maxlen = 400~~ ~~batch_size = 32~~ ~~embedding_dims = 50~~ ~~filters = 250~~ ~~kernel_size = 3~~ ~~hidden_dims = 250~~ ~~epochs = 2~~ ~~(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)~~ ~~print(len(x_train), 'train sequences')~~ ~~print(len(x_test), 'test sequences')~~ ~~> '''25000 train sequences'''~~ ~~'''25000 test sequences'''~~ ~~print('Pad sequences (samples x time)')~~ ~~x_train = sequence.pad_sequences(x_train, maxlen=maxlen)~~ ~~x_test = sequence.pad_sequences(x_test, maxlen=maxlen)~~ ~~print('x_train shape:', x_train.shape)~~ ~~print('x_test shape:', x_test.shape)~~ ~~> '''Pad sequences (samples x time)'''~~ ~~'''x_train shape: (25000, 400)'''~~ ~~'''x_test shape: (25000, 400)'''~~ ~~model = Sequential()~~ ~~model.add(Embedding(max_features,~~ ~~embedding_dims,~~ ~~input_length=maxlen))~~ ~~model.add(Dropout(0.2))~~ ~~model.add(Conv1D(filters,~~ ~~kernel_size,~~ ~~padding='valid',~~ ~~activation='relu',~~ ~~strides=1))~~ ~~model.add(GlobalMaxPooling1D())~~ ~~model.add(Dense(hidden_dims))~~ ~~model.add(Dropout(0.2))~~ ~~model.add(Activation('relu'))~~ ~~model.add(Dense(1))~~ ~~model.add(Activation('sigmoid'))~~ ~~model.compile(loss='binary_crossentropy',~~ ~~optimizer='adam',~~ ~~metrics=['accuracy'])~~ ~~model.fit(x_train, y_train,~~ ~~batch_size=batch_size,~~ ~~epochs=epochs,~~ ~~validation_data=(x_test, y_test))~~ ~~> '''Train on 25000 samples, validate on 25000 samples'''~~ ~~'''Epoch 1/2'''~~ ~~'''25000/25000 [==============================] - 136s 5ms/step - loss: 0.4107 - acc: 0.7923 - val_loss: 0.2926 - val_acc: 0.8746'''~~ ~~'''Epoch 2/2'''~~ ~~'''25000/25000 [==============================] - 136s 5ms/step - loss: 0.2294 - acc: 0.9082 - val_loss: 0.3200 - val_acc: 0.8652'''~~ ~~==Другие библиотеки для машинного обучения на Python=====Вспомогательные библиотеки===~~* NumPy<ref>[http://www.numpy.org Библиотека NumPy]</ref> {{---}} библиотека, добавляющая поддержку больших многомерных массивов и матриц вместе с большой библиотекой высокоуровневых математических функций для операций с этими массивами. Данная библиотека предоставляет реализации вычислительных алгоритмов (в виде функций и операторов), оптимизированные для работы с многомерными массивами. В результате любой алгоритм, который может быть выражен в виде последовательности операций над массивами (матрицами) и реализованный с использованием NumPy, работает так же быстро, как эквивалентный код, выполняемый в MATLAB<ref>[https://www.mathworks.com/products/matlab.html MATLAB]</ref>;* SciPy<ref>[https://www.scipy.org Библиотека SciPy]</ref> {{---}} открытая библиотека высококачественных научных инструментов для языка программирования Python. SciPy содержит модули для оптимизации, интегрирования, специальных функций, обработки сигналов, обработки изображений, генетических алгоритмов, решения обыкновенных дифференциальных уравнений и других задач, обычно решаемых в науке и при инженерной разработке;* Pandas<ref>[https://pandas.pydata.org Библиотека Pandas]</ref> {{---}} библиотека Python, которая является мощным инструментом для анализа данных. Пакет дает возможность строить сводные таблицы, выполнять группировки, предоставляет удобный доступ к табличным данным и позволяет строить графики на полученных наборах данных при помощи библиотеки Matplotlib;* Matplotlib<ref>[https://matplotlib.org Библиотека Matplotlib]</ref> {{---}} библиотека Python для построения качественных двумерных графиков. Matplotlib является гибким, легко конфигурируемым пакетом, который вместе с NumPy, SciPy и IPython<ref>[https://ipython.org IPython Notebook]</ref> предоставляет возможности, подобные MATLAB. ~~===Библиотеки для глубокого обучения===~~* PyTorch<ref>[https://pytorch.org Библиотека PyTorch]</ref> {{---}} библиотека для глубокого обучения, созданная на базе Torch<ref>[https://en.wikipedia.org/wiki/Torch_(machine_learning) Torch]</ref> и развиваемая компанией Facebook. Две ключевые функциональности данной библиотеки {{---}} тензорные вычисления с развитой поддержкой ускорения на GPU и глубокие нейронные сети на базе системы autodiff;* Theano<ref>[http://deeplearning.net/software/theano/ Библиотека Theano]</ref> {{---}} расширение языка программирования Python, позволяющее эффективно вычислять математические выражения, содержащие многомерные массивы. Библиотека предоставляет базовый набор инструментов для конфигурации нейронных сетей и их обучения. Наибольшее признание данная библиотека получила в задачах машинного обучения при решении задач оптимизации. Она позволяет использовать возможности GPU без изменения кода программы, что делает ее незаменимой при выполнении ресурсоемких задач;* Caffe<ref>[http://caffe.berkeleyvision.org Библиотека Caffe]</ref> {{---}} фреймворк для обучения нейронных сетей, созданный университетом Беркли. Как и Tensorflow, использует cuDNN для работы с видеокартами NVIDIA;* Microsoft Cognitive Toolkit (CNTK)<ref>[https://www.microsoft.com/en-us/cognitive-toolkit/ Библиотека CNTK]</ref> {{---}} фреймворк от корпорации Microsoft, предоставляющий реализации архитектур различных нейронных сетей. ~~===Библиотеки для обработки естественного языка===~~* NLTK<ref>[https://www.nltk.org Библиотека NLTK]</ref> {{---}} пакет библиотек и программ для символьной и статистической обработки естественного языка, написанных на языке ~~программирования Python;~~* Gensim<ref>[https://radimrehurek.com/gensim/ Библиотека Gensim]</ref> {{---Java}} инструмент для автоматической обработки языка, основанный на машинном обучении. В Gensim реализованы алгоритмы дистрибутивной семантики word2vec и doc2vec, он позволяет решать задачи тематического моделирования и выделять основные темы текста или документа. ~~===Библиотеки для градиентного бустинга===~~* [[XGBoost|Xgboost]][на 28.01.19 не создан]<ref>[https://xgboost.readthedocs.io/en/latest/python/index.html Библиотека Xgboost]</ref> {{---}} библиотека с реализацией градиентного бустинга, которая для выбора разбиения использует сортировку и модели, основанные на анализе гистограмм;* LightGBM<ref>[http://www.dmtk.io Библиотека LightGBM]</ref> {{---}} фреймворк с реализацией градиентного бустинга от корпорации Microsoft. Является частью проекта Microsoft DMTK, посвященного реализации подходов машинного обучения для .Net;* [[CatBoost|CatBoost]]<ref>[https://catboost.ai Библиотека CatBoost]</ref> {{---}} библиотека с градиентным бустингом от компании Яндекс, в которой реализуется особый подход к обработке категориальных признаков, основанный на подмене категориальных признаков статистиками на основе предсказываемого значения.

==См. также==

*[[:Примеры кода на Scala|Примеры кода на Scala]]

*[[:Примеры кода на R|Примеры кода на R]][на 2808.0104.19 не создан]*[[:~~Примеры кода~~ Обзор библиотек для машинного обучения на ~~Java~~Python|~~Примеры кода~~ Обзор библиотек для машинного обучения на ~~Java~~Python]]

==Примечания==

[[Категория: Машинное обучение]] [[Категория: Примеры кода]]

Анонимный участник

91.215.123.110

Изменения

Обзор библиотек для машинного обучения на Python

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты