SIGNATE 2013年の4大テニストーナメントの試合詳細情報から、試合の結果を予測するモデルを作成
利用者数を予測する
日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。
概要 今回投稿した概要 投稿リンク 暫定評価は 0.9915254 斉藤建一
2013年の4大テニストーナメントの試合詳細情報から、試合の結果を予測するモデルを作成
錦織圭選手や大坂なおみ選手を筆頭に、世界の舞台で日本人が活躍する姿を見ることも珍しくなくなってきました。
ここでは、4大テニストーナメントのデータから、勝敗の予測に挑戦しました。
データ概要
課題種別:分類
データ種別:多変量
学習データサンプル数:471
説明変数の数:45
欠損値:あり
データ説明
学習用データ(train.tsv)、評価用データ(test.tsv)
カラム | ヘッダ名称 | データ型 | 説明 |
---|---|---|---|
0 | id | int | インデックスとして使用 |
1 | Tournament | varchar | 大会名(テニス四大大会) |
2 | Sex | varchar | 性別 |
3 | Year | int | 年度(yyyy) |
4 | Player 1 | varchar | 選手の名前1 |
5 | Player 2 | varchar | プレーヤー2の名前 |
6 | Result | int | 試合の結果(プレーヤー1が勝った場合=1,プレーヤー2が勝った場合=0) |
7 | FSP.1 | int | プレーヤー1のファーストサーブの割合(%) |
8 | FSW.1 | int | プレーヤー1がファーストサーブで勝った割合(%) |
9 | SSP.1 | int | プレーヤー1のセカンドサーブの割合(%) |
10 | SSW.1 | int | プレーヤー1がセカンドサーブで勝った割合(%) |
11 | ACE.1 | int | プレーヤー1のサービスエースの数 |
12 | DBF.1 | int | プレーヤー1のダブルフォルトの数 |
13 | WNR.1 | int | プレーヤー1が獲得した勝者 |
14 | UFE.1 | int | プレーヤー1によってコミットされた強制的なエラー |
15 | BPC.1 | int | プレーヤー1のブレークポイント創出数 |
16 | BPW.1 | int | プレーヤー1のブレーク数 |
17 | NPA.1 | int | プレーヤー1が試みたネットポイント |
18 | NPW.1 | int | プレーヤー1が獲得したネットポイント数 |
19 | TPW.1 | int | プレーヤー1が獲得した合計ポイント |
20 | ST1.1 | int | プレーヤー1の第1セットの獲得ゲーム数 |
21 | ST2.1 | int | プレーヤー1の第2セットの獲得ゲーム数 |
22 | ST3.1 | int | プレーヤー1の第3セットの獲得ゲーム数 |
23 | ST4.1 | int | プレーヤー1の第4セットの獲得ゲーム数 |
24 | ST5.1 | int | プレーヤー1の第5セットの獲得ゲーム数 |
25 | FNL.1 | int | プレーヤー1が最終的に獲得したセット数 |
26 | FSP.2 | int | プレーヤー2のファーストサーブの割合(%) |
27 | FSW.2 | int | プレーヤー2がファーストサーブで勝った割合(%) |
28 | SSP.2 | int | プレーヤー2のセカンドサーブの割合(%) |
29 | SSW.2 | int | プレーヤー2がセカンドサーブで勝った割合(%) |
30 | ACE.2 | int | プレーヤー2のサービスエースの数 |
31 | DBF.2 | int | プレーヤー2のダブルフォルトの数 |
32 | WNR.2 | int | プレーヤー2が獲得した勝者 |
33 | UFE.2 | int | プレーヤー2によってコミットされた強制的なエラー |
34 | BPC.2 | int | プレーヤー2のブレークポイント創出数 |
35 | BPW.2 | int | プレーヤー2のブレーク数 |
36 | NPA.2 | int | プレーヤー2が試みたネットポイント |
37 | NPW.2 | int | プレーヤー2が獲得したネットポイント数 |
38 | TPW.2 | int | プレーヤー2が獲得した合計ポイント |
39 | ST1.2 | int | プレーヤー2の第1セットの獲得ゲーム数 |
40 | ST2.2 | int | プレーヤー2の第2セットの獲得ゲーム数 |
41 | ST3.2 | int | プレーヤー2の第3セットの獲得ゲーム数 |
42 | ST4.2 | int | プレーヤー2の第4セットの獲得ゲーム数 |
43 | ST5.2 | int | プレーヤー2の第5セットの獲得ゲーム数 |
44 | FNL.2 | int | プレーヤー2が最終的に獲得したセット数 |
45 | Round | int | ゲームが行われるトーナメントのラウンド |
※黄色く色付けされた変数が目的変数です(評価用データには含まれません)
応募用サンプルファイル(sample_submit.csv)
サンプルの予測結果が入力された投稿用ファイルのフォーマット
カラム | ヘッダ名称 | データ型 | 説明 |
---|---|---|---|
0 | 無し | int | インデックスとして使用 |
1 | 無し | int | 予測した試合の結果(プレーヤー1が勝った場合=1,プレーヤー2が勝った場合=0) |