讀透模型寫作出發點:
在產品經理10大基礎技能系列文章的上篇文章《 產品經理10大基礎技能(1):讀透SQL》中,筆者LineLian提到過模型概況,本篇文章著重介紹產品經理如何理解模型?在團隊建立模型的過程中產品經理應該懂哪些知識點?然后用口罩需求量的案例展示建立模型的過程和思路。
模型與算法在某種程度上指的是一回事,就像日常生活中你問是先有雞還是先有蛋。模型是使用數學概念和語言來對一個系統的描述。創建模型的過程叫做建模。
模型通常由關系與變量組成。關系可用算符描述,例如代數算符、函數、微分算符等。變量是關注的可量化的系統參數的抽象形式。算符可以與變量相結合發揮作用,也不可以不與變量結合。通常情況下,模型可被分為以下幾類:
1、線性與非線性:在模型中,如果所有變量表現出線性關系,由此產生的模型為線性模型。否則,就為非線性模型。
2、靜態與動態:動態模型對系統狀態隨時間變化情況起作用,而靜態(或穩態)模型是在系統保持平穩狀態下進行計算的,因而與時間無關。動態模型通常用微分方程描述。
3、顯式與隱式:如果整體模型的所有輸入參數都已知,且輸出參數可以由有限次計算求得(稱為線性規劃,不要與上面描述的線性模型相混淆),該模型稱作顯式模型。
4、離散與連續:離散模型將對象視作離散的,例如分子模型中的微粒,又如概率模型中的狀態。而連續模型則由連續的對象所描述,例如管道中流體的速度場,固體中的溫度和壓力,電場中連續作用于整個模型的點電荷等。
5、確定性與概率性(隨機性):確定性模型是所有變量集合的狀態都能由模型參數和這些變量的先前狀態唯一確定的一種模型;因此,在一組給定的初始條件下確定性模型總會表現相同。相反,在隨機模型(通常成為“概率模型”)中存在隨機性,而且變量狀態并不能用唯一值來描述,而用概率分布來描述。
6、演繹,歸納與漂移:演繹模型是創建在理論上的一種邏輯結構。歸納模型由實證研究及演繹模型推廣而得。漂移模型則既不依賴于理論,也不依賴于觀察,而僅僅是對預期結構的調用。
當然模型還有從其他維度劃分的方式,例如從機器學習的維度又可以分為:有監督的模型、無監督的模型和半監督的模型。
本篇按分類所舉的案例屬于線性和非線性的第一類模型。
一般來說建模過程可用如下框圖來表明:
系統拆分建模方法和步驟如下:
1. 模型準備
要了解產品的業務需求實際背景,明確建模目的,搜集必需的各種信息,盡量弄清需求的特征。
2. 模型假設
根據對象的特征和建模目的,對產品業務需求進行必要的、合理的簡化,用精確的語言作出假設,是建模至關重要的一步。如果對問題的所有因素一概考慮,無疑是一種有勇氣但方法欠佳的行為,所以高超的建模者能充分發揮想象力、洞察力和判斷力 ,善于辨別主次,而且為了使處理方法簡單,應盡量使問題線性化、均勻化。
3. 模型構成
根據所作的假設分析對象的因果關系,利用對象的內在規律和適當的數學工具,構造各個量間的等式關系或其它數學結構。建立模型是為了讓更多的人明了并能加以應用,因此工具愈簡單愈有價值。
4. 模型求解
可以采用解方程、畫圖形、證明定理、邏輯運算、數值運算等各種傳統的和近代的數學方法,特別是運用計算機技術以及云計算、和算力芯片技術。
5. 模型分析
對模型解答進行數學上的分析。“橫看成嶺側成峰,遠近高低各不同”,能否對模型結果作出細致精當的分析,決定了你的模型能否達到更高的檔次。還要記住,不論那種情況都需進行誤差分析,數據穩定性分析。
本篇案例文章筆者LineLian以“N95口罩銷量”為背景,通過背景分析、數據收集、數據分析、數學建模、獲得結論等過程,得到牛頓冷卻模型,
(1)、背景分析
背景本案例用新冠病毒背景下用戶購買口罩預防病毒,假設病毒傳染到達高峰以后,用戶對口罩的需求數據到達無病毒狀態下的正常值模型探索。
(2)、數據收集
收集50天內口罩13個區域的口罩總計銷售數據。采集數據如下表所示:
在數據收集中數據產品經理要明白如下知識點
設時間為x,口罩銷量為y,從上表中的數據來看,x,y的取值范圍是什么?
自變量x∈【0,50】,因變量y∈【50,99】。
(3)、數據分析
數據分析是一種統計方法,其主要特點是多維性和描述性。有些幾何方法有助于揭示不同的數據之間存在的關系,并繪制出統計信息圖,以更簡潔的解釋這些數據中包含的主要信息。
本案例是口罩銷量在病毒感染數到達峰值后,口罩銷量和時間是單值對應的,專業的數據產品經理能夠引導團隊選擇合適的函數模型來描述兩者的關系。
例如畫出口罩銷量隨時間變化的大致圖像如下:
數據產品經理需要懂的知識點是,具備一些行業數據分析需要的圖形化思維。
(4)、模型選擇
數據產品經理在模型選擇階段主要懂得知識點是,多儲備一些自己行業所需要的模型。例如口罩銷量隨著疫情被控制而下降案例中,我們可以從一次函數模型嘗試,y=kx+b (其中K≠0),我們肯定都知道,當K>0直線上升,當k<0,直線下降,均不符合口罩在無重大疫情下最終趨于一個常量的特征。
那么常見的二次函數模型y=ax2+bx+c(其中a≠0),能描述口罩隨著疫情被控制隨著時間下降的變化趨勢嗎?也不行,不論開口向上還是向下,當x->+∞時,y->∞,與隨著時間的增加口罩銷量下降并最終趨于一個向量相矛盾。
同樣的,對數函數模型y=m loga x 也不符合。因此可以選擇單調下降的指數函數模型y=ma x(其中00)。
數據產品經理在模型選擇中通過層層啟發,各個擊破,充分培養適合的模型的直觀感知、直覺判斷意識和能力。
(5)、模型建立
確定指數函數模型y=ma x(其中00)。
根據收集的數據,利用Python或者Excel或者其他工具進行精確計算,由計算機自動生成指數函數:y=93.287e? -0.014x。
(6)、模型檢驗
根據函數的圖像性質推斷,指數函數的圖像的發展趨勢比較符合口罩隨疫情高峰時間后的變化規律,如下圖:
但指數函數模型也存在有明顯不足,當x趨于正無窮大時,y趨于0。事實上,沒有疫情下口罩的銷量將趨于一個正常值。
設計意圖,數據建模給出一種研究問題的方法:從基本假設出發,而非從假想結論出發,用嚴謹的數據方法去分析,結合數據挖掘現象背后的數學規律。
從而產品經理大膽提出質疑,發表自己的意見。
(7)、模型建立總結
擬合類函數建立模型時一般可以按以下程序進行操作:
在根據數據特點選擇模型函數時,由于產品業務問題本身的復雜性、開放性,所選擇的模型會有局限性,需要對模型的解進行檢驗或修正;有時由于從收集的數據中選擇的數據不同,得到的擬合模型結果會有所差別,但只要誤差在允許的范圍內就認為是何時的。
最后小結
隨著各個公司對數據的重視,產品經理會無一例外的逐步變成全是懂數據的產品經理,提的產品需求也講全部用數據說話。而運用數據的過程也是建立模型的過程。先理解產品的業務需求,然后再建模的過程中配置模型工程師決定每個數據的產品業務意義,然后用模型的結果來為產品做決策。
本文經授權轉自公眾號:AI逆潮增長(ID:LineLianABC),作者:連詩路LineLian
【投稿人原創】?? 本文由投稿人原創發布于愛盈利,未經投稿人許可,禁止轉載。如有侵權聯系:shanliqiang@aiyingli.com