這種創(chuàng)新發(fā)展的一個例子就是將人工智能應(yīng)用于由傳感器生成的數(shù)據(jù),尤其是通過智能手機(jī)和其他消費(fèi)者設(shè)備所收集的數(shù)據(jù)。運(yùn)動傳感器數(shù)據(jù)以及其他信息比如GPS地址,可提供大量不同的數(shù)據(jù)集。因此,問題在于:“如何使用人工智能才能充分發(fā)揮這些協(xié)同作用?”
運(yùn)動數(shù)據(jù)分析
一個說明性的的真實(shí)應(yīng)用程序?qū)⒖梢酝ㄟ^分析使用數(shù)據(jù)來確定用戶在每個時間段的活動,無論是在坐姿、走路、跑步或者睡眠情況下。
在這種情況下,智能產(chǎn)品的好處不言而喻:
01
提高客戶生命周期價值
提高用戶參與度可以降低客戶流失率。
02
更具競爭力的產(chǎn)品定位
下一代智能產(chǎn)品滿足消費(fèi)者日益增長的期待。
03
為終端用戶創(chuàng)造真正的價值
對室內(nèi)運(yùn)動的準(zhǔn)確檢測和分析可實(shí)現(xiàn)靈敏的導(dǎo)航功能、進(jìn)行健康風(fēng)險監(jiān)控,同時提高設(shè)備的效率。對多種智能手機(jī)和可穿戴平臺實(shí)際使用情景的深度掌握,將大大有助于產(chǎn)品設(shè)計師了解用戶的重復(fù)習(xí)慣和行為,例如確定正確的電池尺寸或確定推送通知的正確時機(jī)。
智能手機(jī)制造商對于人工智能功能的興趣正濃,這也正突出了識別簡單日常活動,如步數(shù)的重要性,這必將發(fā)展為更為深入的分析,例如體育活動。對于像足球這樣的流行體育運(yùn)動,產(chǎn)品設(shè)計師不會只著眼于運(yùn)動員,而是會為更多的人提供便利,比如教練、球迷甚至是廣播公司和運(yùn)動服裝設(shè)計公司等大型公司。這些公司將從深層次的數(shù)據(jù)分析中獲益,從而可以準(zhǔn)確量化、提高和預(yù)測運(yùn)動表現(xiàn)。
數(shù)據(jù)獲取和預(yù)處理
在識別這一商機(jī)之后,下一個合理的步驟就是思考如何有效收集這些巨大的數(shù)據(jù)集。
比如在活動跟蹤方面,原始數(shù)據(jù)通過軸向運(yùn)動傳感器得以收集,例如智能手機(jī)、可穿戴設(shè)備和其他便攜式設(shè)備中的加速度計和陀螺儀。這些設(shè)備以完全隱蔽的方式獲取三個坐標(biāo)軸(x、y、z)上的運(yùn)動數(shù)據(jù),即以便于用戶應(yīng)用的方式連續(xù)跟蹤和評估活動。
訓(xùn)練模型
對于人工智能的監(jiān)督式學(xué)習(xí),需要用標(biāo)記數(shù)據(jù)來訓(xùn)練“模型”,以便分類引擎可以使用此模型對實(shí)際用戶行為進(jìn)行分類。舉例來說,我們從正在進(jìn)行跑步或是走路的測試用戶那里收集運(yùn)動數(shù)據(jù),并把這些信息提供給模型來幫助其學(xué)習(xí)。
由于這基本上是一種一次性方法,簡單的應(yīng)用程序和照相系統(tǒng)就可以完成給用戶“貼標(biāo)簽”的任務(wù)。我們的經(jīng)驗(yàn)表明,隨著樣本數(shù)量的增加,在分類上的人為錯誤率隨之減少。因此,從有限數(shù)量的用戶那里獲取更多的樣本集比從大量用戶那里獲得較小的樣本集更有意義。
只獲取原始傳感器數(shù)據(jù)是不夠的。我們觀察到,要實(shí)現(xiàn)高度準(zhǔn)確的分類,需要仔細(xì)確定一些特征,即系統(tǒng)需要被告知對于區(qū)分各個序列重要的特征或者活動。人工學(xué)習(xí)的過程具有反復(fù)性,在預(yù)處理階段,哪些特征最為重要還尚未明確。因此,設(shè)備必須要依據(jù)可能對分類準(zhǔn)確性有影響的專業(yè)知識進(jìn)行一些猜測。
為了進(jìn)行活動識別,指示性特征可以包括“濾波信號”,例如身體加速(來自傳感器的原始加速度數(shù)據(jù))或“導(dǎo)出信號”,例如高速傅里葉變換(FFT)值或標(biāo)準(zhǔn)差計算。
舉例來說,加州大學(xué)歐文分校的機(jī)器學(xué)習(xí)數(shù)據(jù)庫(UCI)創(chuàng)建了一個定義了561個特征的數(shù)據(jù)集,這個數(shù)據(jù)集以30名志愿者的六項(xiàng)基本活動,即站立、坐姿、臥姿、行走、下臺階和上臺階為基礎(chǔ)。
模式識別和分類
收集了原始運(yùn)動數(shù)據(jù)之后,我們需要應(yīng)用機(jī)器學(xué)習(xí)技術(shù)來將其分類并進(jìn)行分析??晒┪覀兪褂玫臋C(jī)器學(xué)習(xí)技術(shù)從邏輯回歸到神經(jīng)網(wǎng)絡(luò)等不一而足。
支持向量機(jī)(SVMs)就是這樣一個應(yīng)用于人工智能的學(xué)習(xí)模型。身體活動,比如走路包括了由多種運(yùn)動構(gòu)成的序列,由于支持向量機(jī)擅長于序列分類,因此它是進(jìn)行活動分類的合理選擇。
支持向量機(jī)的使用、培訓(xùn)、擴(kuò)展和預(yù)測均十分簡單,所以可以輕松地并列設(shè)置多個樣本采集實(shí)驗(yàn),以用于處理復(fù)雜的現(xiàn)實(shí)生活數(shù)據(jù)集的非線性分類。支持向量機(jī)還可實(shí)現(xiàn)多種不同的尺寸和性能優(yōu)化。
確定一項(xiàng)技術(shù)后,我們必須為支持向量機(jī)選擇一個軟件圖書館。開源庫LibSVM是一個很好的選擇,它非常穩(wěn)定并且有詳細(xì)的記錄,支持多類分類,并提供所有主要開發(fā)者平臺從MATLAB到Android的拓展。
持續(xù)分類的挑戰(zhàn)
在實(shí)踐中,用戶在移動的同時,使用中的設(shè)備要進(jìn)行實(shí)時分類來進(jìn)行活動識別。為了將產(chǎn)品成本降到最低,我們需要在不影響結(jié)果也就是信息質(zhì)量的前提下,平衡傳輸、存儲和處理的成本。
假設(shè)我們可以負(fù)擔(dān)數(shù)據(jù)傳輸?shù)馁M(fèi)用,所有數(shù)據(jù)都可以在云端上獲得存儲和處理。實(shí)際上,這會為用戶帶來巨大的數(shù)據(jù)費(fèi)用,用戶的設(shè)備當(dāng)然要連接互聯(lián)網(wǎng),無線網(wǎng)絡(luò)、藍(lán)牙或4G模塊的費(fèi)用不可避免地將進(jìn)一步提升設(shè)備成本。
更糟糕的是,在非城市地區(qū),3G網(wǎng)絡(luò)的訪問效果通常不理想,例如徒步旅行、騎自行車或游泳時。這種對云端的大量數(shù)據(jù)傳輸?shù)囊蕾嚂垢伦兟⑶倚枰ㄆ谕?,從而大大抵消人工智能運(yùn)動分析帶來的實(shí)際益處。與之相反,僅在設(shè)備的主處理器上處理這些操作會明顯導(dǎo)致耗電量的增加,并且減少其他應(yīng)用的執(zhí)行周期。同理,將所有數(shù)據(jù)都儲存在設(shè)備上會增加存儲成本。
化圓為方
為了解決這些彼此沖突的問題,我們可以遵循四個原則:
01
拆分 -- 將特征處理從分類引擎的執(zhí)行中拆分。
02
減少 -- 智能選擇準(zhǔn)確的活動識別所需的特征,來減少存儲和處理的需求量。
03
使用 -- 使用的傳感器須能夠以較低耗電量獲取數(shù)據(jù)、實(shí)施傳感器融合(將多個傳感器的數(shù)據(jù)結(jié)合在一起),并且能夠?yàn)槌掷m(xù)執(zhí)行進(jìn)行特征預(yù)處理。
04
保留 -- 保留能夠確定用戶活動的系統(tǒng)支持性數(shù)據(jù)的模型。
通過將特征處理與分類引擎的執(zhí)行拆分,與加速度和陀螺儀傳感器連接的處理器可以小得多。這有效避免了將實(shí)時數(shù)據(jù)塊連續(xù)傳輸?shù)礁鼜?qiáng)大的處理器的需求。諸如用于將時間域信號變換為頻率域信號的高速傅里葉變換的特征處理將需要低功耗融核處理器,以執(zhí)行浮點(diǎn)運(yùn)算。
此外,在現(xiàn)實(shí)世界中,單個傳感器存在物理限制,并且其輸出隨時間發(fā)生偏差,例如由于由焊接和溫度引起的偏移和非線性縮放。為了補(bǔ)償這種不規(guī)則性,需要傳感器融合,以及快速、內(nèi)聯(lián)和自動的校準(zhǔn)。
圖上:活動分類的功能流程(來源Bosch Sensortec)
此外,所選擇的數(shù)據(jù)捕獲速率可以顯著影響所需的計算和傳輸量。通常來說,50Hz采樣率對于正常的人類活動就足夠了。但在對快速移動的活動或運(yùn)動進(jìn)行分析時,需要200 Hz的采樣率。同樣地,為了取得更快的響應(yīng)時間,可以安裝2 kHz單獨(dú)加速計來確定用戶目的。
為了迎接這些挑戰(zhàn),低功耗或者應(yīng)用特定傳感器集線器可以顯著降低分類引擎所需的CPU周期。比如Bosch Sensortec的BHI160和BNO055兩個產(chǎn)品就是這種傳感器集線器。相關(guān)軟件可直接以不同的傳感器數(shù)據(jù)速率直接生成融合后的傳感器輸出。
圖左:智能傳感器集線器BHI160:用于活動識別的低功耗智能集線器,專為持續(xù)運(yùn)動傳感而設(shè)計。
圖右:應(yīng)用特定傳感器節(jié)點(diǎn) BNO055:智能9軸“絕對定位傳感器”在單個封裝中將傳感器和傳感器彼此融合。
對待處理特征的初始選擇隨后會極大地影響訓(xùn)練模型的大小、數(shù)據(jù)量以及訓(xùn)練和執(zhí)行內(nèi)聯(lián)預(yù)測所需的計算能力。因此,對特定活動分類和區(qū)分所需的特征進(jìn)行選擇是一項(xiàng)關(guān)鍵的決定,同時也很可能是重要的商業(yè)優(yōu)勢。
回顧我們上文提到的UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫,其擁有561個特征的完整數(shù)據(jù)集,使用默認(rèn)的LibSVM內(nèi)核訓(xùn)練的模型進(jìn)行活動分類的測試準(zhǔn)確度高達(dá)91.84%。然而,完成培訓(xùn)和特征排名后,選擇最重要的19項(xiàng)功能足以達(dá)到85.38%的活動分類測試準(zhǔn)確度。經(jīng)過對排名進(jìn)行仔細(xì)檢查,我們發(fā)現(xiàn)最相關(guān)的特征是頻域變換以及滑動窗口加速度原始數(shù)據(jù)的平均值、最大值和最小值。有趣的是,這些特征都不能僅僅通過預(yù)處理實(shí)現(xiàn),傳感器融合對于確保數(shù)據(jù)的足夠可靠性十分必要,并因此對分類尤為實(shí)用。
結(jié)論
總而言之,科技發(fā)展現(xiàn)在已經(jīng)達(dá)到在便攜式設(shè)備上運(yùn)行高級人工智能來分析運(yùn)動傳感器的數(shù)據(jù)的程度。這些現(xiàn)代傳感器以低功耗運(yùn)行,而傳感器融合和軟件分區(qū)則明顯提高了整個系統(tǒng)的效率和可行性,同時也大大簡化了應(yīng)用程序開發(fā)。
為了補(bǔ)充傳感器的基礎(chǔ)架構(gòu),我們利用開源庫和最佳實(shí)踐來優(yōu)化特征提取和分類。
為用戶提供真正的個性化體驗(yàn)已成為現(xiàn)實(shí),通過人工智能,系統(tǒng)可以利用由智能手機(jī)、可穿戴和其他便攜設(shè)備的傳感器所收集的數(shù)據(jù),為人們提供更多深度功能。未來幾年,一系列現(xiàn)在還難以想象的設(shè)備和解決方案將會得到更多發(fā)展。人工智能和傳感器為設(shè)計師和用戶打開了一個充滿了激動人心的機(jī)會的新世界。