SIGNATE 2013年の4大テニストーナメントの試合詳細情報から、試合の結果を予測するモデルを作成

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク 暫定評価は 0.9915254 斉藤建一

 

2013年の4大テニストーナメントの試合詳細情報から、試合の結果を予測するモデルを作成

錦織圭選手や大坂なおみ選手を筆頭に、世界の舞台で日本人が活躍する姿を見ることも珍しくなくなってきました。
ここでは、4大テニストーナメントのデータから、勝敗の予測に挑戦しました。

データ概要

課題種別:分類
データ種別:多変量
学習データサンプル数:471
説明変数の数:45
欠損値:あり

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラム ヘッダ名称 データ型 説明
0 id int インデックスとして使用
1 Tournament varchar 大会名(テニス四大大会)
2 Sex varchar 性別
3 Year int 年度(yyyy)
4 Player 1 varchar 選手の名前1
5 Player 2 varchar プレーヤー2の名前
6 Result int 試合の結果(プレーヤー1が勝った場合=1,プレーヤー2が勝った場合=0)
7 FSP.1 int プレーヤー1のファーストサーブの割合(%)
8 FSW.1 int プレーヤー1がファーストサーブで勝った割合(%)
9 SSP.1 int プレーヤー1のセカンドサーブの割合(%)
10 SSW.1 int プレーヤー1がセカンドサーブで勝った割合(%)
11 ACE.1 int プレーヤー1のサービスエースの数
12 DBF.1 int プレーヤー1のダブルフォルトの数
13 WNR.1 int プレーヤー1が獲得した勝者
14 UFE.1 int プレーヤー1によってコミットされた強制的なエラー
15 BPC.1 int プレーヤー1のブレークポイント創出数
16 BPW.1 int プレーヤー1のブレーク数
17 NPA.1 int プレーヤー1が試みたネットポイント
18 NPW.1 int プレーヤー1が獲得したネットポイント数
19 TPW.1 int プレーヤー1が獲得した合計ポイント
20 ST1.1 int プレーヤー1の第1セットの獲得ゲーム数
21 ST2.1 int プレーヤー1の第2セットの獲得ゲーム数
22 ST3.1 int プレーヤー1の第3セットの獲得ゲーム数
23 ST4.1 int プレーヤー1の第4セットの獲得ゲーム数
24 ST5.1 int プレーヤー1の第5セットの獲得ゲーム数
25 FNL.1 int プレーヤー1が最終的に獲得したセット数
26 FSP.2 int プレーヤー2のファーストサーブの割合(%)
27 FSW.2 int プレーヤー2がファーストサーブで勝った割合(%)
28 SSP.2 int プレーヤー2のセカンドサーブの割合(%)
29 SSW.2 int プレーヤー2がセカンドサーブで勝った割合(%)
30 ACE.2 int プレーヤー2のサービスエースの数
31 DBF.2 int プレーヤー2のダブルフォルトの数
32 WNR.2 int プレーヤー2が獲得した勝者
33 UFE.2 int プレーヤー2によってコミットされた強制的なエラー
34 BPC.2 int プレーヤー2のブレークポイント創出数
35 BPW.2 int プレーヤー2のブレーク数
36 NPA.2 int プレーヤー2が試みたネットポイント
37 NPW.2 int プレーヤー2が獲得したネットポイント数
38 TPW.2 int プレーヤー2が獲得した合計ポイント
39 ST1.2 int プレーヤー2の第1セットの獲得ゲーム数
40 ST2.2 int プレーヤー2の第2セットの獲得ゲーム数
41 ST3.2 int プレーヤー2の第3セットの獲得ゲーム数
42 ST4.2 int プレーヤー2の第4セットの獲得ゲーム数
43 ST5.2 int プレーヤー2の第5セットの獲得ゲーム数
44 FNL.2 int プレーヤー2が最終的に獲得したセット数
45 Round int ゲームが行われるトーナメントのラウンド

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

応募用サンプルファイル(sample_submit.csv)
サンプルの予測結果が入力された投稿用ファイルのフォーマット

カラム ヘッダ名称 データ型 説明
0 無し int インデックスとして使用
1 無し int 予測した試合の結果(プレーヤー1が勝った場合=1,プレーヤー2が勝った場合=0)