您的位置: 首頁 >互聯(lián)網(wǎng) >

神經(jīng)網(wǎng)絡學習預測臨床訪談中抑郁癥的語言模式

2019-06-11 17:18:10 編輯: 來源:
導讀 為了診斷抑郁癥,臨床醫(yī)生采訪患者,詢問具體問題 - 例如,過去的精神疾病,生活方式和情緒 - 并根據(jù)患者的反應確定病情。近年來,機器

為了診斷抑郁癥,臨床醫(yī)生采訪患者,詢問具體問題 - 例如,過去的精神疾病,生活方式和情緒 - 并根據(jù)患者的反應確定病情。

近年來,機器學習一直被認為是診斷的有用輔助手段。例如,已經(jīng)開發(fā)了機器學習模型,其可以檢測可以指示抑郁的語音的單詞和語調。但是這些模型傾向于根據(jù)個人對特定問題的具體答案來預測一個人是否沮喪。這些方法是準確的,但它們依賴于所詢問的問題類型限制了它們的使用方式和位置。

在Interspeech會議上發(fā)表的一篇論文中,麻省理工學院的研究人員詳細介紹了一種神經(jīng)網(wǎng)絡模型,該模型可以通過采訪發(fā)現(xiàn)原始文本和音頻數(shù)據(jù),以發(fā)現(xiàn)指示抑郁癥的語音模式。給定一個新主題,它可以準確地預測個體是否抑郁,而不需要任何其他有關問題和答案的信息。

研究人員希望這種方法可以用來開發(fā)自然對話中檢測抑郁跡象的工具。例如,在未來,該模型可以為移動應用程序提供支持,以監(jiān)控用戶的文本和語音以進行精神痛苦并發(fā)送警報。由于距離,成本或缺乏對某些可能出錯的認識,這對于那些無法前往臨床醫(yī)生進行初步診斷的人尤其有用。

第一作者,計算機科學和人工智能實驗室的研究員Tuka Alhanai說:“我們首先得到的是一個人快樂,興奮,悲傷,或者有一些嚴重的認知狀況,例如抑郁癥。” CSAIL)。“如果您想以可擴展的方式部署[抑郁檢測]模型......您希望最大限度地減少對您正在使用的數(shù)據(jù)的約束數(shù)量。您希望在任何常規(guī)對話中部署它并讓模型獲取,從自然的互動,個人的狀態(tài)。“

CSAIL的高級研究科學家詹姆斯·格拉斯(James Glass)補充說,該技術當然可用于識別臨床辦公室臨時談話中的精神痛苦。“每個病人的談話方式都不同,如果模特看到變化可能會成為醫(yī)生的旗幟,”他說。“這是向前邁出的一步,看看我們是否可以做一些幫助臨床醫(yī)生的輔助工作。”

該論文的另一位合著者是醫(yī)學工程與科學研究所(IMES)成員Mohammad Ghassemi。

無上下文建模

該模型的關鍵創(chuàng)新在于能夠檢測指示抑郁癥的模式,然后將這些模式映射到新的個體,而無需額外的信息。“我們稱之為'無背景',因為你沒有對你正在尋找的問題類型以及對這些問題的回答類型進行任何限制,”Alhanai說。

其他模型提供了一組特定的問題,然后舉例說明了沒有抑郁癥的人如何做出反應以及抑郁癥患者如何做出反應的例子 - 例如,直截了當?shù)脑儐枺?ldquo;你有抑郁癥病史嗎?” 它使用那些確切的響應,然后在被問到完全相同的問題時確定新個體是否被壓抑。“但這不是自然對話的工作方式,”Alhanai說。

另一方面,研究人員使用了一種稱為序列建模的技術,通常用于語音處理。通過這種技術,他們一個接一個地從抑郁和非抑郁個體的問題和答案中提供文本和音頻數(shù)據(jù)的模型序列。隨著序列的積累,該模型提取了有抑郁癥或沒有抑郁癥的人出現(xiàn)的語音模式。諸如“悲傷”,“低”或“向下”之類的詞語可以與更平坦且更單調的音頻信號配對?;加幸钟舭Y的人也可能說話較慢,并且在單詞之間使用較長的暫停。在以前的研究中已經(jīng)探索了這些用于精神痛苦的文本和音頻標識符。

“該模型可以看到單詞或說話風格的序列,并確定這些模式更容易在抑郁或抑郁的人身上看到,”Alhanai說。“然后,如果它在新科目中看到相同的序列,它可以預測他們是否也被壓抑了。”

這種測序技術還有助于模型將整個會話視為對話,并注意隨著時間的推移,患有抑郁癥的人與不患有抑郁癥的人之間的差異。

檢測抑郁癥

研究人員在來自遇險分析訪談語料庫的142個互動數(shù)據(jù)集上訓練和測試了他們的模型,其中包含對患有精神健康問題的患者和由人類控制的虛擬代理人的音頻,文本和視頻訪談。使用個人健康問卷調查,每個受試者按0到27之間的等級評定抑郁。高于中度(10至14)和中度(15至19)之間的截止值的得分被認為是抑郁的,而低于該閾值的所有其他得分被認為是不抑制的。在數(shù)據(jù)集中的所有主題中,28個(20%)被標記為抑郁。

在實驗中,使用精確度和召回率來評估模型。精確測量由模型識別的哪些抑郁受試者被診斷為抑郁。Recall測量模型在檢測整個數(shù)據(jù)集中被診斷為抑郁的所有受試者時的準確性。在精確度方面,該模型得分為71%,回想起來得分為83%??紤]到任何錯誤,這些指標的平均綜合得分為77%。在大多數(shù)測試中,研究人員的模型幾乎超過了所有其他模型。

Alhanai指出,該研究的一個關鍵見解是,在實驗過程中,模型需要更多的數(shù)據(jù)來預測音頻中的抑郁而不是文本。通過文本,模型可以使用平均七個問答序列準確地檢測抑郁癥。通過音頻,該模型需要大約30個序列。“這意味著人們使用的詞語模式可以預測抑郁癥發(fā)生在文本中的時間跨度比音頻更短,”Alhanai說。這些見解可以幫助麻省理工學院的研究人員和其他人進一步完善他們的模型。

格拉斯說,這項工作代表了一個“非常令人鼓舞”的試點。但現(xiàn)在研究人員試圖發(fā)現(xiàn)模型在大量原始數(shù)據(jù)中識別出哪些特定模式。“現(xiàn)在它有點像黑盒子,”格拉斯說。“然而,當你對他們正在采取什么行動做出解釋時,這些系統(tǒng)更加可信。......接下來的挑戰(zhàn)是找出它抓住的數(shù)據(jù)。”

研究人員還旨在測試這些方法來測試來自更多具有其他認知條件的受試者的額外數(shù)據(jù),例如癡呆。“這不是檢測抑郁癥的重要因素,但它是一種類似的評估概念,從日常的言語信號中評估,如果有人有認知障礙,”Alhanai說。


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。