#自動語音辨識ASR #微機電MEMS #主動降噪ANC #數位音訊放大器 #聲學活動檢測AAD #駐極體電容式麥克風ECM #壓電式微機械超聲換能器PMUT #自然語言理解NLU
【「壓電式」麥克風將全面崛起?】
受惠於超靈敏的聲波感測器和可解釋語音的複雜機器學習演算法,語音識別技術的準確性越發精進。由上述可知,負責接收音訊的麥克風裝置是第一道關卡,它是將聲波轉為電訊號的「換能器」(Transducer)。
對音質、音場的要求越來越高,音訊訊號鏈中所參與的電子元件也變多;為實現輕薄短小的緊湊設計,微機電 (MEMS) 技術應用漸廣。坊間 MEMS 麥克風元件可分為類比、數位兩類;若麥克風收音僅用於靜默監聽、無需播放,音訊鏈後端不必有編解碼器或音訊轉換器,那麼,數位 MEMS 麥克風顯然是首選;反之,牽涉到音訊播放或語音交互,類比 MEMS 則當仁不讓。
整體而言,MEMS 麥克風由於較傳統駐極體電容式麥克風 (ECM) 擁有更好的音質、靈敏度和定向性,便於從數據獲取上、下文進行有效處理和渲染,且功耗、成本更低,體積也小巧得多。不過,為進一步增強抵抗粉塵/微粒、雨水/汗水、震動及高分貝噪音能力,「壓電式」(Piezoelectric) 麥克風成後起之秀。
「壓電式」MEMS 麥克風採用單層薄膜設計的壓電器件不會在背板間隙夾雜灰塵、空氣或雨水等污染物,影響靈敏度和頻率響應,亦避免膜片黏附於背板上。簡言之,它具備防水、防塵、超高聲學過載點、消除迴聲特性,耐用、啟動快且可自供電,對於細微聲響的收音效果更好,更適用於背景雜音大的空間、長距離、戶外或低頻對話,應用面廣泛,但薄膜器件製造不易是其缺點……。
延伸閱讀:
《語音互動靈敏、通話音質清晰——MEMS 麥克風技壓全場》
http://www.compotechasia.com/a/feature/2021/0205/47107.html
#英飛凌Infineon #XENSIV #IM73A135 #艾邁斯半導體ams #AS3460 #東電化TDK #應美盛InvenSense #T5838 #VesperTechnologies #VM3000 #VM3011 #意法半導體ST #A*STAR #IME #ULVAC #WertelOberfell #ESUBTracks #Picovoice
自然語言理解nlu 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
靠AI訂餐廳、快速做人臉辨識,LINE推出3大商用產品要瞄準那些行業?
2020.12.18 by 高敬原
LINE把過去的兩大AI產品線,整併為「LINE CLOVA」,台灣技術長陳鴻嘉說,2021年將與台灣在地企業合作,把LINE的AI技術應用在產品中。
攤開過去LINE的財報,在金融事業、人工智慧(AI)的策略性投資,帶給LINE不少虧損,許多對外發表的應用與技術,仍離商業落地有段距離,LINE財務長黃仁埈曾表示,這些投資都是為了2~3年後的突破做準備。
經過過去一年的努力,現在LINE終於開始要用AI賺錢了!
過去LINE的AI業務,可以分為針對企業的B2B業務「LINE BRAIN」,以及面向用戶的AI技術品牌「LINE CLOVA」,而今年(2020)LINE 台灣開發者大會(LINE TAIWAN TECHPULSE 2020)上的重要焦點,就是LINE把這兩大AI產品線,整併為「LINE CLOVA」。
更重要的是,這些AI技術不再只是概念,LINE台灣技術長陳鴻嘉表示,2021年將與台灣在地企業合作,把LINE的AI技術應用在產品中,解決使用者生活和商業上的繁瑣問題。
推出三大商用產品,LINE開始要用AI賺錢了
針對台灣市場,LINE將會發展「CLOVA Chatbot(聊天機器人)」、「CLOVA Face(臉部辨識)」、「CLOVA OCR(光學字元辨識)」三大人工智慧商用產品,並推出兩大人工智慧解決方案,分別為LINE eKYC和LINE AiCall。
上述的這些應用,背後用到了NLU(自然語言理解)、Face(臉部辨識)、OCR(光學字元辨識)、STT(語音辨識)等AI技術,事實上,無論是eKYC或是LINE AiCall,這些應用在2019年的LINE日本開發者大會上,都已經對外發布,不過礙於語言、技術等因素,還無法在台灣市場落地應用。
2020 年LINE 台灣開發者大會
LINE技術長陳鴻嘉表示,這次釋出的AI技術,本來就已經存在於LINE團隊當中,「會把技術開放出來,是因為我們發現它有效果,想提供給外部開發者,進一步推廣到台灣市場。」過去一年台灣LINE積極地跟日本總部合作,針對中文資料做蒐集、訓練與調教,才能實現商業應用。
「LINE會跟台灣的技術夥伴合作,以 LINE CLOVA 技術提高商業服務的價值,」陳鴻嘉預告,LINE接下來會推出做出不同領域的應用案例,讓 LINE CLOVA 的應用融入台灣市場,這麼做的好處是,能減輕企業自行開發的負擔,最重要的是,能提供用戶更方便的服務。
技術一:CLOVA 聊天機器人
先前CLOVA聊天機器人,因為無法支援日文以外的語言,技術遲遲無法出海,現在這個障礙終於被打破。
根據LINE統計,使用CLOVA聊天機器人(CLOVA chatbot)的服務,在全球已上線超過44個,所累積的問答資料庫達100萬筆、使用超過1億人次,累積的使用者對話保守估計約有17億之多,豐富的資料庫,讓NLU(自然語言理解)技術成為LINE在人工智慧發展的核心,
CLOVA聊天機器人的優勢在於運用LINE的亞洲市場利基,與豐富資料累積,能更精確地判讀使用者的發話意圖和對話內容,對於辨識相對困難的亞洲語言格外擅長。
不只LINE自己發展人工智慧聊天機器人,LINE也提供Chatbot builder這個平台,讓企業開發者減少耗費訓練成本,更彈性、快速地打造聰明的人工智慧聊天機器人,打造好之後,即使是LINE以外的服務或平台,也可以很容易地與其串接。
以LINE內部來說,已經運用Chatbot builder上線的服務像是LINE官方帳號內的Smart chat(AI自動回應訊息)功能,LINE客服小幫手官方帳號,以及已經完成開發的自動報帳系統,陳鴻嘉表示,CLOVA Chatbot從現在起,正式開放台灣企業夥伴合作洽談。
技術二:CLOVA 臉部辨識
「安全性跟速度,是LINE人臉辨識的主要優勢。」許多科技公司都有佈局人臉辨識技術,陳鴻嘉表示,因為LINE以亞洲作為主要市場,因此在臉部辨識技術具有一定優勢基礎。
「CLOVA Face」具備四大功能,以階段性進行辨識作業,首先透過影像做人臉偵測,接著,會讀取臉部特徵和表情做內部校正,最後,以擷取到的特徵值進行辨識和比對,進一步還可藉由臉部樣貌讀取出更細微的資訊,包含年齡、性別和當下心情。
在今年的LINE 台灣開發者大會上,就是使用「CLOVA Face」技術,在30分鐘內完成上千人次入場報到流程。LINE在去年的日本開發者大會上,首次採用自家的人臉辨識技術,完成報到入場,根據記者實測,不像蘋果的FaceID在辨識時會有需要等一下的感覺,「CLOVA Face」整體的辨識速度非常快,幾乎是人臉瞄準鏡頭的當下就完成,體驗相當好。
陳鴻嘉表示,「CLOVA Face」可用平板、智慧型手機等各種裝置,可以一次辨識多張臉部影像,目前也針對年齡識別、辨識速度進行優化,此外,應用範範圍很廣,像是有些公司就將「CLOVA Face」用在差勤系統上。
技術三:CLOVA OCR
「CLOVA OCR」是將OCR(光學字元辨識)與人工智慧技術結合,透過OCR(光學字元辨識)與資料增強法(Data Augmentation),有效提供辨識結果的準確度,並開發出不同模式的OCR產品,包含文字單元辨識極高的general OCR,以及針對特定樣式和規格的specialized OCR,和操作介面簡易且具有AI運算邏輯的OCR Builder。
其中,在Specialized OCR會主要開發台灣最多使用者需要的樣式,例如:健保卡、車票、發票和身分證,更便利大眾的日常生活;而OCR builder則提供一個介面友善的平台,透過機器深度學習達到區域辨識和文字辨識,讓技術更簡單拓展應用面。更進一步,當OCR技術結合Face(臉部辨識),即能發展出AI解決方案LINE eKYC,提供企業界以更數位的方式辨識用戶身分。
應用一:eKYC
許多公司在提供服務之前,會先要求顧客提供證件等個人資料,這個步驟稱為「認識你的客戶(Know your customer),簡稱:KYC」,目的是為了預防身份盜竊、金融詐騙、洗錢及恐怖主義融資,傳統上會要求用戶透過影印的方式提供,通常需要耗費許多時間。
未來「CLOVA Face」也能用於KYC,像是去年四月,LINE Pay在日本推出eKYC技術,用戶只需要拿著證件面對手機鏡頭,拍一張照片,文件及臉部辨識完成後,就等同完成數位化認證作業,就能使用LINE Pay轉帳。
CLOVA Face自現在起正式開放台灣企業夥伴合作洽談,純網銀LINE Bank也即將開幕營運,陳鴻嘉預告,未來也有機會將「CLOVA Face」技術,應用在純網銀的eKYC流程中。
應用二:LINE AiCall
LINE在去年的日本開發者大會上,正式宣布於日本推出AI訂位技術服務「AiCall(AI訂位技術服務)」,這是一款結合語音識別、聊天機器人和語音合成做自然語言處理(NLP),能以極為自然的方式,跟來電訂位的顧客對話。
NAVER AI部門主管都旻兌(KyoungTae Doh)曾分享,根據內部調查,即便手機網路普及,仍有高達65%民眾在訂位時會優先選擇播打電話,然而訂位過程中,因為雙方溝通不良,有很高的機率導致訂位資訊出錯;加上日本勞動力不足,有許多餐廳業者傾向縮減人力,導致電話訂位成餐廳經營的痛點之一。LINE AiCall的出現,就是希望在餐廳尖峰時段,透過AI協助消費者完成電話訂位登記。
LINE AiCall透過STT(語音辨識)和NLU(自然語言理解)兩項技術結合,擅長辨識日常隨興的對話內容和較長的語句,並且在噪音環境內的辨識能力也相當突出。
陳鴻嘉表示,LINE AiCall在日本大多使用在餐飲業訂位的情境,現在支援中文進軍台灣,同樣看好應用在餐飲業,不過要克服的技術困難仍不少,陳鴻嘉舉例,要在台灣落地應用,必須將LINE AiCall與餐廳的POS系統連結,才能做到同步確認當日訂位狀況,「現正逐步完善技術面,關注台灣餐飲市場的需求,同時徵求試行合作案例,為在台商用做準備。」
附圖:LINE 台灣技術長陳鴻嘉預告,LINE接下來會推出做出不同領域的應用案例,讓 LINE CLOVA 的應用融入台灣市場
2020 年LINE 台灣開發者大會
在今年的LINE 台灣開發者大會上,就是使用「CLOVA Face」技術,在30分鐘內完成上千人次入場報到流程。
ekyc
去年四月,LINE Pay在日本推出eKYC技術。
今年(2020)LINE 台灣開發者大會(LINE TAIWAN TECHPULSE 2020)上的重要焦點,就是LINE把過去的兩大AI產品線,整併為「 LINE CLOVA」。
LINE AiCall
陳鴻嘉表示,LINE AiCall在日本大多使用在餐飲業定位的情境,現在支援中文進軍台灣,同樣看好應用在餐飲業,不過要克服的技術困難仍不少。
高敬原攝影
資料來源:https://www.bnext.com.tw/article/60614/line-techpulse-2020-?fbclid=IwAR3Otjiw-cxkCjwgDOGNTGMfaV-Py07AiZ2G_nVcv9LDOgwkiKmg80CjuUw
自然語言理解nlu 在 創業小聚 Meet Startup Facebook 的精選貼文
#創業之星┃👽取經 Google 自然語言技術,APMIC還要透過AI掌握你的情緒!
▌什麼是 #自然語言理解 技術(NLU)?
所謂「自然語言」簡單來說便是大家平時的說話方式,而「自然語言理解(NLU)」則是指透過機器學習,讓電腦也能「懂人話」。近期以「防疫機器人」聞名的台灣新創APMIC正專注於協助企業打造兼具語音、文字、人臉辨識的智能對話平台。
▎創新亮點
APMIC 透過AI技術 #克服傳統行銷的限制:它跨平台、跨裝置、跨文字、跨語音、跨圖像。社群媒體提供服務的平台五花八門,然而無論是 LINE、Messenger、What’s App、WeChat,都是 APMIC 智能行銷所能導入的社群軟體,且這些平台的數據皆能統一回流至數據中台分析,自動整合了管理企業數據。
▌創業快問快答
Q:創業至今,做得最好的三件事為何?
1. 找到一群志同道合創業夥伴,讓公司可以有更強大的推進力。
2. #給所有員工發聲執行的機會,每個人可以看到的角度是不一樣的,要尊重所有人的意見。
3. 找到對的時間點,創業需要天時地利人合,目前正是自然語言應用崛起之時
Q:創業,教會了你哪些事?簡單分享創業至今以來的心得感想?
我想從創業中學到最多的應該是「執行」,若是在外領薪水,或多或少都會有怠惰的時候,偍是當自己出來創業時,眼看公司戶頭就要歸零,還有什麼理由可以怠惰?還有什麼理由可以只動嘴而不往下執行?每個人每天的時間有限,當時間不夠時就會逼自己學習時間管理,就會逼自己學習企業管理;當錢不夠時就逼自己學習業務能力,沒有任何不去學的道理,我想這「#執行力」就是創業到現在學到最重要的事。
看更多APMIC的創業故事
https://pse.is/R78KJ1
自然語言理解nlu 在 漫談元宇宙中的NPC 對話:自然語言對話背後的技術 - Facebook 的必吃
如果你看過"脫稿玩家" (Free Guy) 這部電影(Disney+ 可以看到),應該會對"元宇宙" 的感受更加深刻。 自然語言理解 ( NLU )是已經是現在非常熱門的技術, ... ... <看更多>
自然語言理解nlu 在 Line Bot 聊天機器人開發使用ChatGPT 自然語言理解(NLU) 的必吃
開發語言:Python系統:Windows 10聊天機器人Line 整合. ... Line Bot 聊天機器人開發使用ChatGPT 自然語言理解 ( NLU )- 自然語言生成(NLG). ... <看更多>