Изменения

Обзор библиотек для машинного обучения на Python

2103 байта добавлено, 13:41, 23 января 2019

Нет описания правки

Scikit-learn<ref>[https://scikit-learn.org/stable/ Библиотека scikit-learn]</ref> {{---}} библиотека машинного обучения на языке программирования Python с открытым исходным кодом. Содержит реализации практически всех возможных преобразований, и нередко ее одной хватает для полной реализации модели. В данной библиотеки реализованы методы разбиения датасета на тестовый и обучающий, вычисление основных метрик над наборами данных, проведение кросс-валидации. В библиотеке также есть основные алгоритмы машинного обучения: линейной регрессии, (и ее модификаций Лассо, гребневой регрессии), опорных векторов, решающих деревьев и лесов и др. Есть и реализации основных методов кластеризации. Кроме того, библиотека содержит постоянно используемые исследователями методы работы с параметрами (фичами): например, понижение размерности методом главных компонент. Частью пакета является библиотека imblearn<ref>[https://imbalanced-learn.readthedocs.io/en/stable/index.html Библиотека imbalanced-learn]</ref>, позволяющая работать с разбалансированными выборками и генерировать новые значения.

===Примеры кода===

====Линейная регрессия====

Основная статья: [[Линейная регрессия]]

# Add required imports

'''import''' matplotlib.pyplot '''as''' plt

'''import''' numpy '''as''' np

'''from''' sklearn '''import''' datasets

'''from''' sklearn.linear_model '''import''' LinearRegression

'''from''' sklearn.metrics '''import''' mean_squared_error, r2_score

Загрузка датасета:

diabetes = datasets.load_diabetes()

# Use only one feature

diabetes_X = diabetes.data[:, np.newaxis, 2]

Разбиение датасета на тренировочный и тестовый:

# Split the data into training/testing sets

x_train = diabetes_X[:-20]

x_test = diabetes_X[-20:]

# Split the targets into training/testing sets

y_train = diabetes.target[:-20]

y_test = diabetes.target[-20:]

Построение и обучение модели:

lr = LinearRegression()

lr.fit(x_train, y_train)

predictions = lr.predict(x_test)

Оценка алгоритма:

# The mean squared error

print("Mean squared error: %.2f"

% mean_squared_error(y_test, predictions))

# Explained variance score: 1 is perfect prediction

print('Variance score: %.2f' % r2_score(y_test, predictions))

> '''Mean squared error: 2548.07'''

'''Variance score: 0.47'''

Построение графика прямой, получившейся в результате работы линейной регрессии:

plt.scatter(x_test, y_test, color='black')

plt.plot(x_test, predictions, color='blue', linewidth=3)

plt.xticks(())

plt.yticks(())

plt.show()

[[File:Diabetes-sklearn.png|400px|none|super]]

====Логистическая регрессия====

Основная статья: [[Логистическая регрессия]]

Alexey Katsman

333

правки

Изменения

Обзор библиотек для машинного обучения на Python

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты