china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關注微信公眾號
移動端
創頭條企服版APP

教你用Python分析相親網站數據,在兩萬異性中找到真愛

4650
網絡大數據 2019-09-27 11:33 搶發第一評
Chris McKinlay利用Python腳本瀏覽了上百道OkCupid的問卷題目,然后把女性用戶分為七類,每一類都會貼上獨特的標簽,例如“多才多藝的”和“細心體貼的”等等。

本文來自公眾號:大數據文摘(BigDataDigest),來源:Wired,編譯:啤酒泡泡、張大筆茹、張睿毅、牛婉楊

想脫單?那還不容易!

如果身在美國,就像其余四千萬單身男人一樣,注冊一下Match.com, J-Date和OkCupid等相親網站,坐等真愛上門不就可以了。

但是相信大多數人和McKinlay一樣,盡管向OkCupid算法推薦匹配的女性發送了許多曖昧私信,但絕大多數都石沉大海了。

轉折出現在2012年6月的一個早上,這個只進行過6次線下約會的男人正在電腦上編譯機器代碼,另一個窗口顯示著他孤零零的交友頭像,他突然頓悟:他一直在使用錯誤的方法尋找愛情。

為了不辜負自己在應用數學領域取得的成績,他決定,在OkCupid上爬取每一條相關信息,利用關鍵的K-Modes的改良貝爾實驗室算法找出數據規律,縮小范圍,然后一擊命中。

換句話說,這是一次數學家獨創的完美約會經驗貼,還不快來看看!

第一步:分析失敗原因,知己知彼

OkCupid是哈佛大學的數學系學生于2004年創立的約會網站,最初這個網站吸引人們注意力的是它基于計算方法的配對模式。會員會回答很多多項選擇問題,這些問題覆蓋面很廣,包括政治、宗教、親情、性、以及智能手機等。

?

數學家Chris McKinlay

通常,系統會從上千道問題的題庫里選出350道問題—— “以下哪種情形最有可能讓你去看電影?”或是“宗教/上帝在你的生活中有多重要?”

對于每一道問題,用戶會選擇一個答案,以說明自己伴侶的哪一個回答是他可以接受的,并通過給問題評分來表明問題對自己的重要性(5分制,從無關緊要到必須回答)。OkCupid的匹配引擎會利用這些數據來計算男女之間的合適程度。越接近100%,所謂數學意義上的靈魂伴侶就越匹配。

McKinlay從數學上分析了自己一直以來的失敗原因。

OkCupid的算法只會使用雙方都愿意回答的問題去計算,而McKinlay選擇的問題有些隨機,并不主流。當他查看與自己匹配的人時,匹配度超過90%的女人不到100個。要知道,洛杉磯有兩百萬女性(大約八萬女性在使用OkCupid)。如果把匹配度比作可見度,那McKinlay可以說就是個看不見的幽靈。

他意識到他應該去提高匹配的人數。如果McKinlay通過統計取樣確定哪些問題是他喜歡類型的女人愿意回答的,那么他便可以誠實地回答這些問題而忽略其他問題,以此來創建一個全新的用戶。利用這個辦法,他可以匹配到在洛杉磯的每一個可能與他配對的女人,而不會匹配到不合適的人。

?

?

第二步:借助Python,求助好友,瘋狂收集數據

Chris McKinlay利用Python腳本瀏覽了上百道OkCupid的問卷題目,然后把女性用戶分為七類,每一類都會貼上獨特的標簽,例如“多才多藝的”和“細心體貼的”等等。

即便作為一個數學家,McKinlay也是個不同尋常的人。他小時候在波士頓郊區長大,2001年他從Middlebury學院畢業并獲得漢語言學位。同年8月份,他在紐約世貿中心北塔91層的一家公司里找了一份兼職工作,工作內容是將中文翻譯成英文。五周后的一天,世貿大廈倒塌了。(那天,下午兩點前McKinlay都沒來公司。當第一架飛機于早上8點46分撞上大廈的時候,他正在睡覺。)

“自從那件事后,我問自己,我究竟想做什么”他說。他的一個在哥倫比亞大學的朋友招聘他進入了一個由麻省理工職業21點團隊衍生出的一個團隊,這之后的幾年里,他便往返于紐約和拉斯維加斯,他的工作是數牌,一年能掙六萬美金。

這段經歷點燃了他對應用數學的興趣,最終促使他在這個領域取得了碩士和博士學位。“他們能夠在很多不同的情景下使用數學知識,”他說,“他們會見到一些新的游戲,比如‘三張牌的牌九撲克’,然后回家寫點代碼,接著就能找到策略去打敗它。”

現在,他想用同樣的方式去尋找愛情。首先,他需要數據。就在他用旁邊的窗口進行論文寫作的時候,他建了12個假的OkCupid賬戶并寫好了Python腳本去管理這些賬戶。這個腳本會搜索他的目標群體(25到45歲的異性戀或雙性戀的女人),訪問她們的主頁,然后爬取她們賬戶上每一條有用的信息:種族、身高、是否吸煙、星座—— “這些我全都要”他說。

?

?

為了找到心儀的另一半,他還做了一些額外調查。OkCupid可以讓用戶看到其他人的回答,但只能看到那些他們自己已經回答過的問題。 于是McKinlay設置了自己的機器人程序,以簡單地隨機回答每個問題,他并沒有使用虛擬的個人資料吸引任何女性,因此答案并不重要,主要他要將這些女性的答案收集到了數據庫中。

McKinlay滿意地看著他程序一路狂奔。 然后,在收集了大約一千個檔案后,他遇到了第一個障礙。OkCupid有一個短平快的系統來防止這種,他的程序一個接一個地被禁。

因此他必須把自己的程序訓練的更像真人一些。

他求助他的神經科學家朋友Sam Torrisi,最近剛教過McKinlay音樂理論以換取高級數學課程。Torrisi也注冊了OkCupid,他同意在他的計算機上安裝間諜軟件來監控該網站的使用。根據手中的數據,McKinlay通過編程模擬Torrisi的點擊率和打字速度。他從家里帶來了第二臺電腦并將其插入數學系的寬帶線路,以便可以24小時不間斷運行。

三周后,他已經收集了來自全國各地20000名女性的600萬個問題和答案。

第三步:將20000名女性分為7類,找出最適合自己的

按照McKinlay的工作計劃,他需要從調查數據中找到一個規律,即需要根據相似性粗略地對女性進行分組。這個問題在他編寫一個名為K-Modes的改良貝爾實驗室算法時取得了進展。

K-Modes算法1998年首次用于分析患病的大豆作物。

他通過算法發現了一個自然的分割點,根據問題和答案,20,000名女性被分為成七個統計學組。 “我太高興了,”他說,“那是六月份令我最興奮的事情了。”

他重新設置條件來收集另一個樣本庫:在過去一個月內登錄OkCupid的來自洛杉磯和舊金山的5000名女性。通過K-Modes的另一次分組確認他們以類似的方式聚集并確保統計抽樣有效。

現在只需要決定哪個類群最適合他了,在抽查了每個類群的一些檔案后,發現一個類群太年輕,兩個太老,另一個太“基督”了。于是他徘徊在一個二十五歲左右的女性主導的類群中,工作類型比較獨立,像是音樂家和藝術家。這簡直是黃金單身群!

就像是大海撈針,他找到了他的針,也就在這個類群的某個地方,他找到了真愛。

一個相鄰的類群看起來也引起了McKinlay的注意:年齡稍微大一些,從事專業的創造性工作,如編輯和設計師。他決定將兩個類群都設定為自己的目標!于是設置了兩個配置文件,A、B組各優化一個。

第四步:真誠填寫相關問題,找出靈魂伴侶

他對這兩個類群進行了文本挖掘以了解她們感興趣的內容:教學是一個熱門話題,因此他撰寫了一篇強調了他作為數學教授工作的文章。

更重要的是回答問題,于是他挑選了兩個類群中最受歡迎的500個問題并決定誠實地填寫答案,他不想在計算機生成的謊言的基礎上建立未來的戀愛關系。但是他會使用一種稱為自適應提升的機器學習算法來得出最佳權重,從而讓計算機確定分配每個問題的重要性。

?

?

有了這個后他發表了兩個照片,一個是攀巖的照片,另一個是在音樂演出中彈吉他。

“無論未來的計劃如何,你現在對什么更感興趣?性還是愛?” 這個問題的答案很明顯是愛。但對于年輕的A群,他尊重計算機將問題評為“非常重要” 的結果。對于B群集,它則是“必須回答”的問題。

當回答完最后一個問題時,他按照匹配百分比對洛杉磯的女性進行了OkCupid搜索。從頭開始:第一頁匹配率全是99%女性。向下滾動......然后......向下滾動……,來自洛杉磯各地的一萬名女性迎面而來。

離被關注還差一步! OkCupid會員在有人查看他們的網頁時會收到通知,因此他寫了一個新程序來訪問查看他主頁的女性的主頁,并按年齡循環:周一有1000名41歲的女性,周二有1000名40歲的女性。兩周后,輪到了27歲的女性。女性會回訪他的個人資料,每天約400名左右。然后,私信開始滾滾而來。

“直到現在我還沒有遇到過如此匹配的人,而且我發現你的個人資料很有趣,”一位女士寫道,“對于一個擅長數字的粗獷男人......我覺得我想認識你。”

“嘿,你的個人資料很棒,我想認識你,”另一位寫道,“我認為我們有很多共同之處,也許不是數學,但肯定還有很多!”

“你真的會翻譯中文嗎?” 還有人問道,“我上了一些課,但學的并不好。”

至此,數學部分已經完成。接下來,他需要離開他的小隔間,進入實際演練階段,他要去真正的約會!

第五步:走出小隔間,來一場真正的約會

6月30日, McKinlay開著他的尼桑穿越城鎮來到加州大學洛杉磯分校的健身房,開始他的約會實踐。Sheila是一位來自“A類群”的年輕的網頁設計師。他們在Echo Park的一家咖啡館吃了午飯。 “太不可思議了,這簡直像一場學術活動一樣。”

與Sheila約會結束后,雙方都覺得不來電。第二天,McKinlay進行了第二次約會,一個來自 “B類群”的博客編輯。他們計劃在Echo Park Lake周圍散步,卻發現正在施工。女方一直在讀普魯斯特并對生活感到失望。 “這有點令人沮喪,”他說。

第三天的約會也來自“B類群”。他在韓國城的一家酒吧遇到Alison。 她是一名實習編劇,肩膀上還紋了斐波那契螺旋。McKinlay喝了很多韓國啤酒,第二天帶著痛苦的宿醉在他的小隔間醒來。他后來在OkCupid上私信她表示想繼續約會,但她沒回。

雖然他被拒絕了,但每天仍然收到20條消息。實踐約會顯然與計算機配置文件約會是完全不同的。他開始忽略一些主頁沒有內容的人的消息,只回應那些有幽默感或在首頁展示一些有趣的東西的人。以前他作為主動方,會交換三到五條消息來獲得一個約會日期。現在就只發一個回復。 “你看起來很酷。想見面么?”

20個約會之后,他總結了一些潛在的規律。在較年輕的群體中,女性大多數有兩個或更多的紋身,而且住在洛杉磯的東邊。另一組中,她們瘋狂的喜歡中型犬。

早期的約會他會經過精心策劃。但當工作越來越忙時,就開始在午餐或咖啡時間偶爾參加休閑聚會,而且經常一天之內約兩場。他制定了一套個人規則來完成“馬拉松愛情”搜索:不再約喝酒,如果不來電就趕快結束不要拖拉,不約音樂會或電影。 “約會中你們需要關注的是彼此而不是別的什么東西,不然效率會很低。”

經過從他的兩個檔案中同等挑選約會的一個月后,他發現他耗費了太多時間在紋身群中接觸東邊的女性。他刪除了他的A組簡介。他的效率雖然提高了,但結果是一樣的。隨著夏天即將結束,他已經有過超過55次約會,每日都盡職地在實驗筆記本上記錄。只有三個產生了第二次約會,只有一個進行了第三次。

大多數不成功的約會者都面臨著自尊問題。對于McKinlay來說其實更糟糕。他不得不檢查他的計算。

后來一個來自28歲的藝術家Christine Tien Wang發來了消息。McKinlay之前在加州大學洛杉磯分校附近搜索到她,6英尺高藍眼睛的人,正在那里修她的美術碩士學位。他們有91%的適合度。

他在校園的雕塑花園遇見了她。從那里他們走到一個大學壽司會場,他立刻感覺到了來電了!他們談論了書籍、藝術、音樂,當她承認她在給他發消息之前對她的個人資料做了一些小改動后,他給她講述了關于他黑進愛情網站的整個經過。

“我認為這樣做有點腹黑和憤世嫉俗,”她說,“但我喜歡。”

這是第一次約會,第二次緊隨其后,然后是第三次約會。兩周后,他們都暫停了他們的OkCupid帳戶。

我認為我所做的只是每個人在站點上所做事情的一種略微算法化,大規模且基于機器學習的版本。” McKinlay說。每個人都試圖創建一個最佳的配置文件,他只是有數據來設計一個。

這是他們第一次約會的一年后,McKinlay和Tien Wang在韋斯特伍德壽司吧臺和一位記者見面,他們的已經正式確定關系了。McKinlay獲得了博士學位,他正在教數學,目前正在攻讀音樂研究生學位。Tien Wang被卡塔爾錄取并獲得為期一年的藝術獎學金。她在加州和McKinlay見面。他們一直在Skype上保持聯系。

根據記者的要求,McKinlay帶來了他的實驗筆記本。 Tien Wang之前沒見過它。這是McKinlay緊密筆跡中的公式和方程式的頁面,以一個整齊排列的女性名單和約會清單結尾,其中含有一些簡短的注釋。Tien Wang掃讀了一遍,覺得一些亮點有點可笑。 她注意到,8月24日,他在同一天帶了兩個女人到同一個海灘。她說: “太可怕了。”

對Tien Wang來說,McKinlay的OkCupid黑客歷程是一個有趣的故事。但所有的數學和編碼只是他們故事的序幕。見面后,戀愛關系才真正被黑客入侵。 “人們比他們的個人資料要復雜得多,”她說,“所以我們遇到的方式有點膚淺,但我們之間發生的一切都不是膚淺的,它是通過彼此的努力培養出來的。”

“這不是說,我們匹配因此我們關系很好,” McKinlay表示贊同, “這只是一種將我們放在同一個空間的機制,我能夠使用OkCupid找人。”

Tien Wang對此有點慍怒:“你沒找到我,我找到了你。”她摸著他的手肘說道。McKinlay停下來思考,然后承認她是對的。

一周之后,Tien Wang又回到了卡塔爾,這對夫婦每天都會撥打一個Skype電話。當McKinlay拿出鉆石戒指并將其舉到網絡攝像頭前像她求婚時,Tien Wang說 “我愿意”。

他們結婚時間并不完全確定,McKinlay說需要進一步研究以確定最佳婚禮日。

相關報道:https://www.wired.com/2014/01/how-to-hack-okcupid/

分享到:0收藏

上一篇:80本值得一讀的最佳數據科學書籍(一) 美國國稅局如何通過高級數據分析來打擊欺詐下一篇:

聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
您閱讀這篇文章花了0
轉發這篇文章只需要1秒鐘
喜歡這篇 0
評論一下 0
凱派爾知識產權全新業務全面上線
相關文章
評論
試試以這些內容開始評論吧
登錄后發表評論
凱派爾知識產權全新業務全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創服務
歷史搜索 清空

Tel:18514777506

關注微信公眾號

創頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
久久se精品一区精品二区| 国产一区二区精品在线观看| 日本不卡的三区四区五区| 成人免费福利片| 制服丝袜中文字幕亚洲| 国产精品视频麻豆| 裸体歌舞表演一区二区| 日本高清无吗v一区| 国产日韩精品久久久| 日韩va欧美va亚洲va久久| 99国产精品国产精品毛片| 亚洲精品在线三区| 日韩国产在线一| 欧美性xxxxxxxx| 亚洲欧美中日韩| 国产一区二区三区免费在线观看| 欧美高清激情brazzers| 亚洲精品美腿丝袜| 成人黄色777网| 久久久久久一级片| 久久国产福利国产秒拍| 51午夜精品国产| 亚洲一区成人在线| 91老司机福利 在线| 国产精品麻豆欧美日韩ww| 狠狠色2019综合网| 日韩一区二区精品在线观看| 亚洲综合精品自拍| 91麻豆国产福利在线观看| 欧美激情在线一区二区三区| 韩国精品主播一区二区在线观看| 日韩视频一区二区三区在线播放| 亚洲一级在线观看| 在线精品视频免费播放| 亚洲欧美韩国综合色| 北条麻妃国产九九精品视频| 国产亚洲成av人在线观看导航| 国产综合成人久久大片91| 精品久久久久久久一区二区蜜臀| 日产国产欧美视频一区精品| 欧美日韩三级一区二区| 一区二区不卡在线播放| 在线观看亚洲a| 亚洲综合自拍偷拍| 欧美午夜精品理论片a级按摩| 亚洲激情中文1区| 欧美一a一片一级一片| 亚洲一二三区在线观看| 欧美网站一区二区| 日日摸夜夜添夜夜添精品视频 | 欧美一二三在线| 日本人妖一区二区| 日韩亚洲电影在线| 麻豆成人在线观看| 久久免费美女视频| 成人av电影在线网| 亚洲欧美激情一区二区| 欧美偷拍一区二区| 免费观看在线综合色| 日韩欧美成人一区| 国产精品一二三| 中文字幕在线观看不卡| 色综合中文字幕| 亚洲午夜精品网| 91精品国产乱码| 狠狠色综合播放一区二区| 中文字幕二三区不卡| 91麻豆福利精品推荐| 午夜欧美在线一二页| 91精品中文字幕一区二区三区 | 日韩欧美国产精品| 国产精品99久| 亚洲品质自拍视频| 欧美精品aⅴ在线视频| 极品销魂美女一区二区三区| 国产精品毛片大码女人| 欧美日韩亚洲不卡| 久久精品国产亚洲aⅴ| 欧美高清在线精品一区| 欧美亚洲日本一区| 久久国产生活片100| 国产欧美一区二区三区鸳鸯浴 | 一区二区在线看| 欧美一区二区三区在线观看视频 | 欧美一区欧美二区| 国产精品白丝av| 亚洲视频 欧洲视频| 91精品国产综合久久小美女| 国产精品资源网站| 亚洲永久精品大片| 精品国产乱码久久久久久久久| 成人sese在线| 日韩精品福利网| 国产女主播视频一区二区| 欧美性感一类影片在线播放| 国产中文一区二区三区| 亚洲狼人国产精品| 精品国产区一区| 色哟哟国产精品| 极品少妇一区二区| 亚洲综合成人在线视频| 久久天天做天天爱综合色| 色美美综合视频| 狠狠v欧美v日韩v亚洲ⅴ| 亚洲美女屁股眼交3| 欧美精品一区二区三区一线天视频| 91一区二区在线观看| 久久99这里只有精品| 一级做a爱片久久| 国产视频不卡一区| 欧美精品在线观看播放| 成人禁用看黄a在线| 日本欧洲一区二区| 中文字幕欧美一区| 精品国产一区二区三区av性色| 色综合激情五月| 国产麻豆视频一区二区| 午夜伊人狠狠久久| 亚洲欧洲成人精品av97| 亚洲精品在线电影| 欧美性xxxxxxxx| 成人动漫一区二区在线| 精品在线亚洲视频| 亚洲高清在线视频| 国产精品国产三级国产普通话99| 日韩午夜在线观看| 欧美三区免费完整视频在线观看| 成人激情小说网站| 国产美女在线观看一区| 日韩va亚洲va欧美va久久| 亚洲男同性视频| 中文字幕av一区二区三区免费看| 欧美sm美女调教| 91精品国产全国免费观看| 色婷婷久久一区二区三区麻豆| 国产精品正在播放| 久久精品国产精品青草| 亚洲成a人v欧美综合天堂| 亚洲欧美日韩中文字幕一区二区三区| 久久久久国产免费免费| 欧美成人猛片aaaaaaa| 7777女厕盗摄久久久| 日本韩国欧美一区| 91视视频在线观看入口直接观看www | 日韩欧美久久一区| 欧美日韩成人一区二区| 91福利资源站| 色综合久久久久| 99视频国产精品| 成人午夜视频在线| 国产成人激情av| 国产综合久久久久久久久久久久| 日韩专区中文字幕一区二区| 亚洲第一综合色| 亚洲午夜精品久久久久久久久| 亚洲欧美日韩中文字幕一区二区三区| 中文av一区二区| 亚洲国产高清aⅴ视频| 国产日产欧美一区二区三区| www国产成人| 久久久综合视频| 国产亚洲短视频| 日本一区二区三区四区| 日本一区二区三区久久久久久久久不 | 丰满亚洲少妇av| 亚洲精品视频免费看| 日韩一区有码在线| 国产清纯美女被跳蛋高潮一区二区久久w | 国产精品进线69影院| 欧美精品在欧美一区二区少妇| 国产一区二区中文字幕| 亚洲在线视频免费观看| 精品久久人人做人人爽| 99热99精品| 日韩av一区二区三区| 亚洲bt欧美bt精品| 激情欧美一区二区三区在线观看| 亚洲黄色免费网站| 亚洲综合一区在线| 亚洲成人动漫在线免费观看| 亚洲一区自拍偷拍| 午夜视频一区在线观看| 爽好多水快深点欧美视频| 香蕉久久夜色精品国产使用方法 | 成人的网站免费观看| 99热这里都是精品| 在线一区二区视频| 欧美福利视频导航| 日韩一区二区三区视频在线| 精品国产免费一区二区三区香蕉| 久久久蜜桃精品| 国产精品嫩草影院av蜜臀| 亚洲色图一区二区| 亚洲国产aⅴ成人精品无吗| 日本欧美一区二区| 国产麻豆午夜三级精品| 不卡的电影网站| 在线视频一区二区三| 欧美一区二区黄| 国产蜜臀97一区二区三区 |