SIGNATE ワインの品種の予測に投稿しました

2020年2月23日

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク 暫定評価は1.0

ワインの化学成分から使用されているぶどうの品種を予測するモデルを作成していただきます

特別な日のディナーなど、多くの人が楽しむワイン。その種類は、赤、白、ロゼ、スパークリングなど様々ですが、原材料にはぶどうを使用します。
成熟した頃に収穫されたぶどうは、茎など余分な部分を取り除き、絞られた果汁をタンクに入れて発酵させます。その後、樽などで熟成させることで、美味しいワインが完成します。
さて、今回は、ワインの化学成分から、ぶどうの品種の予測にチャレンジしていただきます。

本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。

データ概要

課題種別:分類
データ種別:多変量
学習データサンプル数:89
説明変数の数:13
欠損値:無し

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラムヘッダ名称データ型説明
0idintインデックスとして使用
1Ycharワインの品種番号(1~3)
2Alcoholfloatアルコール
3Malic acidfloatリンゴ酸
4Alcalinity of ashfloat灰のアルカリ性
5Ashfloat
6Magnesiumintマグネシウム
7Total phenolsfloatフェノール類全量
8Flavanoidsfloatフラバノイド
9Nonflavanoid phenolsfloat非フラバノイドフェノール類
10Proanthocyaninsfloatプロアントシアニン
11Color intensityfloat色彩強度
12Huefloat色調
13OD280/OD315 of diluted winesfloat蒸留ワインのOD280/OD315
14Prolineintプロリン

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

応募用サンプルファイル(sample_submit.csv)

1列目に評価用データの”id”を、2列目に予測した”Y”(=ワインの品種番号)を記入したファイルを、ヘッダ無しcsv形式で投稿ください。

カラムヘッダ名称データ型説明
0無しintインデックスとして使用
1無しchar予測したワインの品種番号(1~3)

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110