Знаете ли вы, как эксперты классифицируют вина? Конечно, первый параметр – это вкус напитка. Однако существует более десятка других параметров, определяющих класс вина.
Состав вина может значительно отличаться в зависимости от нескольких факторов, таких как сорт винограда, регион произрастания, климат, тип почвы и техника виноделия. Различные сорта винограда обладают отличительными качествами, которые влияют на вкус вина.
Например, Каберне Совиньон известен своим насыщенным вкусом с оттенками черной смородины и фиалки, в то время как Шардоне обладает легким вкусом с ароматами зеленого яблока и цитрусовых.
Условия произрастания в различных регионах также влияют на уровень кислотности винограда. Если в более холодных регионах получаются кислые вина, то в более теплом климате – более сладкие. Виноделы контролируют процесс ферментации, который также влияет на сложность вина. Выдержка в дубовых бочках или в резервуарах из нержавеющей стали также влияет на его вкусовые качества.
Все эти различные элементы вносят свой вклад в уникальные вариации состава вина. И мне было интересно посмотреть на эти признаки более конкретно. А также посмотреть, сможет ли машинное обучение справиться с классификацией вин не хуже человека. И я должен признать, что все получилось довольно хорошо.
В Сети я нашел набор данных с основными признакам вин и использовал Python, чтобы сделать следующее:
- Анализ EDA качества вин.
- Классификация вин методом линейного дискриминантного анализа (LDA).
- Построение модели машинного обучения для прогнозирования качества вина.
- Повторная классификация LDA на ограниченной выборке и двух признаках в данных — золе и флавоноидах.
- Визуализация разделения вин на классы.