SIGNATE 銀行の顧客ターゲティング 1位 2020/03/01 現在
日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。
https://signate.jp/competitions/1/leaderboard 斉藤建一
今回投稿した概要 投稿リンク 0.99439 2019/07/15
本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。
活用するデータは、実際のビジネス環境で得られたもので、マーケティングキャンペーンの効率化を図るためのモデリングを行います。
過去、このデータを使用して書かれた論文によるモデリング精度を超えることを目指し、腕試しがてらコンペに参加してみてください。
データ概要
データ
使用するデータは、ある銀行の顧客属性データおよび、過去のキャンペーンでの接触情報、などで、これらのデータを元に、当該のキャンペーンの結果、口座を開設したかどうかを予測します。
学習用のデータは、27,168名の顧客データとキャンペーンの結果(口座開設の有無)です。
予測する対象は、18,083名のキャンペーンに対する反応(結果)を予測していただきます。
予測に使用する変数(説明変数)は16で、これらの変数は学習用、予測対象の両方のデータに含まれます。
予測対象となる変数は、学習用のデータにのみ含まれます。
変数の詳細や、データ形式については、「データをダウンロード」ページをご参照ください。
本コンペで使用するデータは、以下のサイトおよび論文からの引用です。
Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science.
[Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference – ESM’2011, pp. 117-121, Guimarães, Portugal, October, 2011. EUROSIS.
データ説明
学習用データ(train.tsv)、評価用データ(test.tsv)
予測対象となる目的変数はカラム番号”17″の定額預金申し込み有無です。ただし、検証用データには含まれません。
カラム | ヘッダ名称 | データ型 | 説明 |
---|---|---|---|
0 | id | int | 行の通し番号 |
1 | age | int | 年齢 |
2 | job | varchar | 職種 |
3 | marital | varchar | 未婚/既婚 |
4 | education | varchar | 教育水準 |
5 | default | varchar | 債務不履行があるか(yes, no) |
6 | balance | int | 年間平均残高(€) |
7 | housing | varchar | 住宅ローン(yes, no) |
8 | loan | varchar | 個人ローン(yes, no) |
9 | contact | varchar | 連絡方法 |
10 | day | int | 最終接触日 |
11 | month | char | 最終接触月 |
12 | duration | int | 最終接触時間(秒) |
13 | compaign | int | 現キャンペーンにおける接触回数 |
14 | pdays | int | 経過日数:前キャンペーン接触後の日数 |
15 | previous | int | 接触実績:現キャンペーン以前までに顧客に接触した回数 |
16 | poutcome | varchar | 前回のキャンペーンの成果 |
17 | y | boolean | 定額預金申し込み有無(1:有り, 0:無し) |
応募用サンプルファイル(sample.csv)
応募用ファイルのサンプルデータです。
カラム | ヘッダ名称 | データ型 | 説明 |
---|---|---|---|
0 | 無し | int | インデックスとして使用する通し番号 |
1 | 無し | float | 予測した定額預金申し込みの確率値 |
※黄色く色付けされた変数が目的変数です(評価用データには含まれません)
弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110