校園一卡通是集身份認(rèn)證、金融消費(fèi)、數(shù)據(jù)共享等多項(xiàng)功能于一體的信息集成系統(tǒng)。在為師生提供優(yōu)質(zhì)、高效信息化服務(wù)的同時(shí),系統(tǒng)自身也積累了大量的歷史記錄,其中蘊(yùn)含著學(xué)生的消費(fèi)行為以及學(xué)校食堂等各部門的運(yùn)行狀況等信息。
很多高校基于校園一卡通系統(tǒng)進(jìn)行“智慧校園”的相關(guān)建設(shè),例如《揚(yáng)子晚報(bào)》2016年 1月 27日的報(bào)道:《南理工給貧困生“暖心飯卡補(bǔ)助”》。
不用申請(qǐng),不用審核,飯卡上竟然能悄悄多出幾百元……記者昨天從南京理工大學(xué)獨(dú)家了解到,南理工教育基金會(huì)正式啟動(dòng)了“暖心飯卡”
項(xiàng)目,針對(duì)特困生的溫飽問(wèn)題進(jìn)行“精準(zhǔn)援助”。
項(xiàng)目專門針對(duì)貧困本科生的“溫飽問(wèn)題”進(jìn)行援助。在學(xué)校一卡通中心,教育基金會(huì)的工作人員找來(lái)了全校一萬(wàn)六千余名在校本科生 9 月中旬到
11月中旬的刷卡記錄,對(duì)所有的記錄進(jìn)行了大數(shù)據(jù)分析。最終圈定了 500余名“準(zhǔn)援助對(duì)象”。
南理工教育基金會(huì)將拿出“種子基金”100萬(wàn)元作為啟動(dòng)資金,根據(jù)每位貧困學(xué)生的不同情況確定具體的補(bǔ)助金額,然后將這些錢“悄無(wú)聲息”的打入學(xué)生的飯卡中,保證困難學(xué)生能夠吃飽飯。
——《揚(yáng)子晚報(bào)》2016年 1月 27日:南理工給貧困生“暖心飯卡補(bǔ)助”本賽題提供國(guó)內(nèi)某高校校園一卡通系統(tǒng)一個(gè)月的運(yùn)行數(shù)據(jù),希望參賽者使用
數(shù)據(jù)分析和建模的方法,挖掘數(shù)據(jù)中所蘊(yùn)含的信息,分析學(xué)生在校園內(nèi)的學(xué)習(xí)生活行為,為改進(jìn)學(xué)校服務(wù)并為相關(guān)部門的決策提供信息支持。
-
1. 分析學(xué)生的消費(fèi)行為和食堂的運(yùn)營(yíng)狀況,為食堂運(yùn)營(yíng)提供建議。
-
2. 構(gòu)建學(xué)生消費(fèi)細(xì)分模型,為學(xué)校判定學(xué)生的經(jīng)濟(jì)狀況提供參考意見(jiàn)。
附件是某學(xué)校 2019年 4月 1 日至 4月 30日的一卡通數(shù)據(jù)
一共3個(gè)文件:data1.csv、data2.csv、data3.csv



將附件中的
data1.csv、data2.csv、data3.csv三份文件加載到分析環(huán)境,對(duì)照附錄一,理解字段含義。探查數(shù)據(jù)質(zhì)量并進(jìn)行缺失值和異常值等方面的必要處理。將處理結(jié)果保存為“task1_1_X.csv”(如果包含多張數(shù)據(jù)表,X可從
1 開(kāi)始往后編號(hào)),并在報(bào)告中描述處理過(guò)程。
將 data1.csv中的學(xué)生個(gè)人信息與 data2.csv中的消費(fèi)記錄建立關(guān)聯(lián),處理結(jié)果保存為“task1_2_1.csv”;將 data1.csv
中的學(xué)生個(gè)人信息與data3.csv 中的門禁進(jìn)出記錄建立關(guān)聯(lián),處理結(jié)果保存為“task1_2_2.csv”。
繪制各食堂就餐人次的占比餅圖,分析學(xué)生早中晚餐的就餐地點(diǎn)是否有顯著差別,并在報(bào)告中進(jìn)行描述。(提示:時(shí)間間隔非常接近的多次刷卡記錄可能為一次就餐行為)

通過(guò)食堂刷卡記錄,分別繪制工作日和非工作日食堂就餐時(shí)間曲線圖,分析食堂早中晚餐的就餐峰值,并在報(bào)告中進(jìn)行描述。


根據(jù)上述分析的結(jié)果,很容易為食堂的運(yùn)營(yíng)提供建議,比如錯(cuò)開(kāi)高峰等等。
根據(jù)學(xué)生的整體校園消費(fèi)數(shù)據(jù),計(jì)算本月人均刷卡頻次和人均消費(fèi)額,并選擇 3個(gè)專業(yè),分析不同專業(yè)間不同性別學(xué)生群體的消費(fèi)特點(diǎn)。



根據(jù)學(xué)生的整體校園消費(fèi)行為,選擇合適的特征,構(gòu)建聚類模型,分析每一類學(xué)生群體的消費(fèi)特點(diǎn)。

