用一條數學公式破解人類記憶 | MIT媒體實驗室Nature新作
2022-01-14由 大資料文摘 發表于 農業
幾何衰減和快速衰減
大資料文摘出品
作者:蔣寶尚、魏子敏
MIT媒體實驗室一直是一家將社會人文學科與自然科學巧妙融合的代表機構。每年,這些腦洞大開的科學家們都會發布一些非常震撼的研究。
比如2016年,他們研究了為什麼每一年去世的名人都在變多?早些時候,他們釋出了一個實驗,研究了無人駕駛場景下,面對電車困境時,人們會做出什麼樣的選擇。
就在上週,這個實驗室釋出了一篇論文,稱破解出了
關於人類記憶的數學公式。
這篇刊登在《自然(Naure)》雜誌子刊
Nature Human Behavior
上的文章稱,
透過設定少量的幾個引數,已經能畫出公眾對文化作品記憶力隨時間變化的曲線。
真實的集體記憶力公式
論文發表在《Nature Human Behavior》
先附上論文地址
https://www。nature。com/articles/s41562-018-0474-5。epdf?referrer_access_token=t7Nyf7YyMkLNLIzCMsL7JdRgN0jAjWel9jnR3ZoTv0PvtXQtxXhXuhju8gaqKI2mz1wc2DeS9siF5z5Q2U2C7TdYHfVWhYACN4JB_s7XAtMherXA1SIPryFE7w5dydML81qKmQTmJyM50nekNcVdq3QLLw97AZM1Nsvga4M0cygqgD3vXvwqV3_-FeRNMRU7CeCM5b5MDYF0pbKO-6PtMh57Wv2myZqMoMSerqbvrvCLelznyzqXhgALuVfA1mztZ7M8LQMqu7_xAhJMbokEyCotcwqf6yedUux_p_8yrlg%3D&tracking_referrer=www。scientificamerican。com
覺得閱讀論文太枯燥的同學,Nature也做了一個小影片來解釋這個發現
數學可能是距離本質最近的學科,無數人都曾經思考,人類的生命是否由一條數學公式掌握?這個問題太過異想天開,以至於只能在影視作品中以科幻的形式討論。
《天才J》就是這樣一部電影,電影中的高中生阿J破解出了人類生命的終極數學公式,利用數學公式對抗邪惡力量,拯救人類於水火。
“傳說”中的生命公式
儘管破解生命的公式還遙不可及,但是,來自MIT的科學家讓我們離這個目標更近了一步,巧妙的將人文學科和自然學科融合在了一起。
那麼,他們是如何破解記憶力公式的呢?
具體來說,麻省理工學院媒體實驗室的研究人員發現了公眾注意力(記憶)時間變化,表現為雙指數曲線。
在論文開頭,科學家們引用了詩人Pabllo Neruda 最著名的詩歌 Poema 20(不愧是最有藝術文化感的實驗室啊)。
Love is so short, forgetting is so long
愛情如此短暫,遺忘卻如此漫長
這首詩歌強烈的表達了生動的愛情往往是短暫的,以及會隨著歲月的流逝這種感覺會逐漸從記憶中消失。
除了詩歌和愛情,這篇論文把公眾對電影,傳記,專利文章以及藝術作品的注意力時間變化進行了量化。
研究發現,當人們在聽歌曲、看電影以及傳記時,一開始有非常強的關注度,但是注意力開始衰退時遵循的指數曲線往往是在最開始快速的下降,在後期下降的速率開始減緩。
人類集體記憶衰退的普遍模式
這種注意力的上升和下降的機制是兩種不同模式的結合。第一種機制是優先依附(preferential attachmen),即文化產品的受歡迎程度吸引人的注意力。根據以前的觀點,現在流行的歌曲、電影或文章在未來會比不那麼受歡迎的歌曲電影吸引更多的注意力。
第二種機制是時間衰減,這是科學家透過比較觀察到的,在這個階段也分為兩個小的階段,即快速衰減階段和緩慢衰減階段。這也是為什麼集體對某事物的關注度會以指數函式的形式衰減。
為了解釋集體注意力的衰退,研究人員建立了一個基於交流記憶以及文化記憶這兩個人類學概念的模型。交流記憶著重於說話產生的注意力,文化記憶著重於從書籍和硬碟的資訊所得到的注意力。
模型對第一階段之後的集體記憶衰退進行了預測。公眾對詩歌,例如Poema 20,首先表現出的是交流記憶,一個有著非常強的歡迎程度但集體注意確是短暫的時期;然後是文化記憶,這個階段涉及較少的注意力和較慢的衰減,因為在後期,詩歌會以電影、書籍、音訊的模式記錄下來。
這也揭示了交流記憶階段的是注意力是非常短的情況。
在傳記中,交流記憶持續20~30年,音樂維持的時間大約為約5~6年。
對各種傳播平臺進行研究得出的注意力衰退曲線
總的來說,集體注意力會沿著一條曲線衰減,這種曲線可以解釋為交流記憶和文化記憶的結合。
模型綜述
研究人員使用兩種型別的資料:科學論文和專利的時間序列資料、歌曲,電影和傳記的橫截面資料。
資料總結
在模型中把假設進行了簡化,儘可能少的引數,從而得到一個操作性強的模型,該模型可以量化集體注意力主要變數,在這些假設下,交流記憶衰減的數學公式是u(t+1)=(1p)u(t)ru(t),文化記憶衰減為v(t+1)=(1q)v(T)ru(T)。兩者的綜合模型方程為S(t)=u(t)+v(t)
交流記憶對時間求導為:du/dt=-(p+r)u
文化記憶對時間求導為:dv/dt=-qv+ru
最初的交際記憶設定為u(t=0)=N,假設過程開始時,沒有文化記憶模型,即v(t=0)=0。利用初始條件,我們發現方程的解是一個雙指數函式:
注: 雙重指數函式(Double exponential function)是指將指數函式的指數提升為指數函式所形成的函式。
在方程S(t)=N/(p+r-q)*[(q-p)*e^-(p+r)t+re-qt] 中,p、q、r分別為引數,當這些引數變化時,雙指數曲線呈現以下變化 。其中p+r是交流記憶下降的速率。q是在文化記憶中起作用的引數。引數r表現了交流記憶到文化記憶中的資訊流動。
經過對論文,專利,歌曲,電影和生物學等文學作品的資料分析表明,這種符合雙指數函式的衰減模型在所有領域都是普遍存在的。
然而,論文,專利,歌曲,電影和傳記各對應一個衰減函式,也就是其p、r、q的各取不同的值。
上面也提到了,公眾的注意力衰減由兩個機制構成,第一個機制是交流記憶,第二個機制是文化記憶。研究人員在論文中用t-c定義了從交流記憶過渡到文化記憶之間需要花費的時間:
透過研究發現音樂和電影的交流記憶衰減比傳記的快得多。這也導致了音樂和電影比傳記維持的時間短。另外,還發現對於傳記而言p q,即傳記的交流記憶維持的時間長於文化記憶的時間。
模型綜述
最後,文摘菌也帶大家推導一遍模型的表示式,這是個非常簡捷的公式,對於學過大學微積分以及線性代數的同學,下面的過程完全能夠看懂。
兩個記憶機制的變化速率為:
利用線性代數的知識可以把方程寫成矩陣的形式:
對變數初始化為:
然後,要求解方程組,首先要求出2×2矩陣的本徵值,透過計算矩陣行列式(Det),即:
對於A,可以得到了λ_1=(P+r)和λ_2=q,然後計算特徵向量,也就是求解n_1,n_2:
利用λ_1=(P+r)和λ_1=q,解得特徵特徵向量為:
透過解微分方程,得到方程式的通解為:
其中,C_1、C_2為任意常數。
利用初始條件,解得C_1=N,C_2=(N*r)/p+r-q 解得特解為:
最後,雙指數函式模型為:
利用資料對模型進行擬合得到方程:
或許,我們距離用數學解釋生命也沒有那麼遙遠。