跳到主要內容

為什麼總是單身?-BI資料分析實例




資料分析到底怎麼做?
為什麼我們要做資料分析?
資料分析看起來很陌生很無趣嗎?

德昂資訊透過分析生活中有趣的小事,帶你一步一步走進資料分析的世界,讓你真切感受到資料背後的意涵,讓你知道其實資料分析並不遙遠,它充滿在我們生活中的大大小小事情上!


「你為什麼交不到交男/女朋友?」





相信大家都遇過下面這個情境:

無論是大小節日或普通假日回家,每次只要和爸媽或家中長輩阿姨叔叔爺爺奶奶吃飯聚會時,總是會不停地被追問.............

「你交男/女朋友了嗎?」
單身的你/妳總是百口莫辯,無法反駁和回嘴,
但其實單身也不是你願意的,心裡只覺得滿腹委屈。




不過,接下來,讓我們從一個有趣的心理學實驗,將男女交往配對時的機率看得更透徹吧!

實驗背景
麻省理工為了找出男女配對的邏輯曾經做過這樣一個心理學實驗。實驗人員找來100位大學生,男女各半,然後製作了100張卡片,從1至100編號,貼在大學生的背後。具體的實驗規則如下:
1.男生單數編號,女生雙數編號,但他們不知道所有編號最大的是100,最小的是1;
2.編號貼在背後,自己只能看見别人的編號,但不能把别人的編號告訴他;
3.實驗要求大家在有限時間内去找一個異性配對,配對成功即可獲得兩人背後數字總和十倍的獎金。
大家猜猜結果會怎樣?





實驗開始
由於大家都不知道自己背後的數字,因此首先就是觀察别人。
編號大的學生,自然帶著「男神」、“女神”光環,吸引了一大波的追求者。他們雖然不知道自己背後編號的具體數值,但也能確定自己處於配對的優勢地位。
與之相反,編號小的學生,無人問津,在短短數小時内感受到了人情冷暖。
可想而知,那些編號大的學生在所有的追求者中盡情挑選;而那些碰壁的追求者迫於無奈只能退而求其次,選擇低於原本目標的人湊合著過了;還有些人還會和對方商量,以給對方更多的獎金為條件實現配對。

最後,大部分學生都成功配對,當然也有堅持不配對單身結束遊戲的大學生。


實驗結果
實驗的結果和預想的差不多,絕大多數人與其配對對象背後的編號差距都在10以内,也就是古人所說的:「門當户對」。
有趣的是,100號女生的配對對象不是99號男,也不是97號或95號,竟然是73號男生,兩人編號相差了27!

原來100號女生被眾多的追求者冲昏了頭,因為不知道100是最大值,也不知道自己就是100號,她一直在等待更大數字的男人。等到大家都配對完畢,她終於開始慌了,於是她在剩下的男生裡找了一個數字最大的,就是那位73號幸運兒。

沒錯,這場心理學實驗完全就是人類戀愛行為的縮影呀!


資料模擬
下面我們建立數學模型來分析這個有趣的現象。
(現實世界當然更加紛繁複雜,遠比模型中的設定更加難以捉摸,此模型僅供供娛樂)
第一步,我們來確定群體特徵
群體中男女數量一致;
群體中每個人都有一個分值,而群體的分值符合平均數為60,標準差為10的正態分布。
於是,我們可以得到人群的數值分布,如下圖所示:


第二步,我們來確定配對規則
1.對所有人進行異性間的隨機配對。由於現實社會中許多配對都是男性的綜合條件略強於女性,我們在模型中設定,當男性的分值不低於女性,且配對雙方的分值差距在[0,10]分範圍内,視為配對成功,否則配對失敗;
2.配對失敗的人將進入下一輪配對,規則同上;配對成功的人不進入下一輪配對;此步驟循環進行。
按此規則,多次迭代,可以得到配對次數與成功率之間的關係


看出,配對成功率會隨著配對次數增加而提高,但提高的速度在不斷減小,並且在配對次數達到8次以後儘管配對次數繼續增加,成功率的增加則微乎其微。
意思是,8次之後還沒成功,便要注定孤老一生了嗎?
先別急著下結論,我們不妨先來看看不同分值人群的成功配對率吧。



可以看到,不同分值人群的成功配對率差異極大:
50-70分區間人群的成功配對率是很高的。高分男性的成功配對率極高,低分男性的成功率極低;而女性與之截然相反,分值高的女性成功配對率極低。
這與我們原本的觀念也是一致的,女強人很容易熬成齊天大“剩”;相反,“男人40一枝花”,大齡男性有時反而會更受歡迎。
當然,通過這個模型,我們不難找出一些方法來提高匹配的成功率。


精準匹配



原本的匹配方法是在所有1-100分值的人中隨機匹配,那如果匹配的範圍縮小呢?從上圖可以看出,前幾次的匹配成功率得到了顯著提高,但最後趨於平缓的匹配成功率甚至低於隨機匹配的成功率。
而精準匹配,指的就是「相親」。
這也不難理解,在生活中可以透過相親在一定標準内進行選擇從而更高效地找到對象,但也可能因為局限於相親對象而讓你錯失真命天子(女)。
除此以外還有其他方法,例如降低擇偶標準等等,在此不再多加分析。


結論
作為理性的經濟人,婚姻的本質就是一種利益交換,就是一場換取更高價值的博弈。
但是,不要忘記有個變量,叫做「愛情」。



留言

這個網誌中的熱門文章

【如何建構BI系統業務?】(二)你知道要分析的內容是什麼嗎?

【導讀】 BI 專案是如何推進的?包含了那些過程?存在哪些模式嗎?德昂資訊在此要分享一位超資深 BI 工程師的經驗總結,從使用者識別、分析內容確立、專案應用、展示設計到後續行動的支持,期望幫你建立基礎但深刻的 BI 專案知識體系。 Let's Go! 本系列內容 每週三推送,本日送上第二篇,一共五篇, 精彩內容不要錯過! 【前言】 在上一篇文章中,我們跟大家分享了「 BI 業務系統建構方法五步驟」的第一步驟: 識別使用者 , 在第一步驟中,我們確定了商務智能系統的最終用戶,根據用戶在企業組織中的層級位置和崗位職責,我們可以初步確定每個用戶關注的業務範圍。 【今日焦點】 今天我們談 第二個步驟 —— 確定分析內容 接下來,第二步驟則是談我們如何為這些用戶提供具體業務指標以及業務分析內容,可歸納成下面這三道手續: 收集業務分析需求、提煉業務指標、建構業務分析線路。 1.  收集業務分析需求: 理論上,最終用戶作為商務智能系統的業務驅動方,我們直接跟他們進行業務調研就能獲取到準確的數據分析需求。但實際上,在大部分專案裡,我們在跟最終用戶做需求調研時,都會被問這些問題: 「別的企業都做了些什麼?」 「你們做過這麼多BI專案,應該比較有經驗吧?你們建議我們看什麼?」 這些提出問題的用戶又分成 兩種客戶類型 : (1)第一種是很了解商務智能系統的作用,但就是想參考一下同行業或者是同模塊的案例,想站在巨人的肩膀上直接做到最好(如下圖左邊的人) (2)第二種則是完全不知道商務智能系統是什麼,將它與現有業務系統進行比較,認為現有系統已滿足日常工作需要,對商務智能系統能產生的價值抱持懷疑態度(如下圖右邊的人) 所以在實際的專案裡,作為專案實施方,我們需要根據用戶提供需求的能力對用戶進行分類,然後採用不同的手段進行業務需求收集,所以我們又可以根據需求明確和不明確的客戶將其劃分為下列四種類型. (1)R1 類型的用戶: 出沒頻率:可遇不可求。 特性:此類用戶的業務分析需求非常明確,有確定的業務主題、確定的指標以及業務分析維度,最極致的是有還明確的報...

【如何建構BI業務系統?】(一)什麼是BI呢?誰會使用BI呢?

【導讀 】 BI 專案是如何推進的?包含了那些過程?存在哪些模式嗎?德昂在此要分享一位超資深 BI 工程師的經驗總結,從使用者確認、分析內容確立、專案應用、展示設計到後續行動的支持這五個步驟,期望幫你建立基礎但深刻的 BI 專案知識體系。 Let’s Go! 本系列內容 每週三推送 , 一共五篇,精彩內容不要錯過! 。 【前言 】 首先,我們先通俗地理解一下什麼是 商務智能分析系統 ,商務智能( Business Intelligence ,簡稱: BI )就是為了讓特定的人在 適當的時間使用適合的方式看到適當的數據 並能有所行動。 那這種天時(適當的時間)地利(適合的方式、適當的數據)人和(特定的人、有所行動)是如何做到的呢? 別急、別急、這個問題其實不難,那有多簡單呢? 其實只比把大象放到冰箱裡多了兩個步驟而已! ! ! (不懂這個笑話的詳見文末) 【進入正題】 好啦,言歸正傳, 以下是 建構商務智能分析的 五步驟 : 1. 識別 使用者 : 明確使用者所屬的組織範圍。 2.  確定分析內容 : 確定使用者數據使用的邊界,這包含了解使用者要解決的業務問題,定位他關注的指標及維度。 3.  設計應用場景 : 明確了解使用者在什麼時間什麼場景使用分析內容。 4. 設計展示形式 : 明確能夠幫助使用者快速獲取關鍵資訊的數據呈現形式。 5. 添加輔助功能 : 明確哪些技術支持工作(如發送郵件、進行數據評論等)可以幫助行動落實,便於後期的業務跟踪。 【今日焦點】 今天我們談 第一個步驟 —— 識別使用者 數據價值說到底還得看實際應用的能力, BI 說到底還得讓 “ 人” 用起來才有意義,因此,把識別使用者作為建構商務智能分析系統的第一步再正確不過。需求調研過程中要根據每層用戶的特點開發定向的應用內容,以提高系統的使用率,和避免開發過程內容的重複設計。 在集中管控型的企業中,人員的層次結構基本上都是金字塔型,可以分為三大類,每層用戶的的定位以及用戶特點如下圖: 1....

25萬公里衰減不到10%,買了特斯拉可以放心開!

|特斯拉續航里程保持水準 你的iPhone電池會有衰減,電腦電池也有衰減,一切生活中出現的鋰電池,都不可能沒有衰減。 那麼電動汽車呢? 全球最大特斯拉粉絲論壇特斯拉汽車俱樂部從2014年開始發起了一項名為MaxRange的車主調查,持續蒐集全球各地特斯拉車主的電量衰減數據截止至9月5日,調研項目的Google Docs表格已經收集了超過1000位亞太,歐洲(不含英國),加拿大,美國,英國的真實數據。 最新的 數據分析結果 顯示,無論是電池生產工藝更好的新車,還是早期下線的舊車,電池容量衰減都大致遵循了 三元鋰電池「先快後慢」 的模式,而即使行駛里程多達25萬公里,絕大多數參與調查的用戶都只有遇到了 少於10%的續航里程衰減 。 (注意,這裡縱坐標從85%開始,圖片來自: Steinbuch ) 考慮到參與這個調查的主要用戶群體是亞太地區和歐洲,覆蓋了炎熱,寒冷多個層次的氣溫,還囊括了城市擁堵,高速公路,山路等路況,用戶的充放電習慣也各不相同,所以雖然樣本數量不是特別多,也足以讓我們對特斯拉鋰電池的衰減有一個比較理性的認知。 25萬公里,衰減率不到10%,再加上直接驅動車輛的電動機壽命遠比結構複雜的內燃機更長,這樣的數據絕對是給懶得花時間做保養的人推銷電動汽車。鋰電池的研究正在快速進步,除了每年例行的容量遞增外,科學家也在不斷地給鋰電池續命。 2016年5月份,特斯拉聘請了加拿大鋰電池研究的專家Jeff Dahn,幫助特斯拉電池研究部門持續提高電動汽車鋰電池性能。在接下來一段時間裡,Jeff Dahn和曾經的特斯拉首席電池科學家Kurt Kelty成為了特斯拉鋰電池研究的兩大“門神”,後者領導了特斯拉Model 3新型2170電池的開發和量產。 ( Jeff Dahn ) (Kurt Kelty,圖片來自: Fortune ) |成本、壽命、能量密度 今年2月份,Jeff在接受加拿大自然科學與工程研究協會採訪時透露了雙方合作的三個主要目的: 降低鋰電池的成本。事實上經過Kurt Kelty研發部門的努力,特斯拉的鋰電池生產成本已經從Roadster時代的每kWh 1200美元降低到Model 3 2170鋰電池大約190美元/ kWh。 延長使用壽命。...