99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話Wispr Flow 創(chuàng)始人 Tanay:語(yǔ)音輸入,如何創(chuàng)造極致的 Voice AI 產(chǎn)品體驗(yàn)

0
分享至


文章轉(zhuǎn)載于Sentrum Okern
作者:Vela

最近,硅谷的AI語(yǔ)音輸入產(chǎn)品Wispr Flow背后公司完成Menlo Ventures 領(lǐng)投的 3000 萬(wàn)美元 A 輪融資。

這是一款讓用戶在任何應(yīng)用內(nèi)都能通過(guò)語(yǔ)音進(jìn)行輸入,支持 104 種語(yǔ)言,并會(huì)根據(jù)不同應(yīng)用場(chǎng)景基于AI能力自動(dòng)調(diào)整語(yǔ)調(diào)和格式的產(chǎn)品。在諸多使用反饋中,用戶對(duì)它評(píng)價(jià)很高。它的絲滑程度,產(chǎn)品設(shè)計(jì)和智能感讓人印象深刻。

今天我們獲權(quán)轉(zhuǎn)載一篇與其創(chuàng)始人 Tanay Kothari 的對(duì)話,作者Vela為在硅谷的語(yǔ)音產(chǎn)品創(chuàng)業(yè)者。

如果說(shuō)硅谷最近有什么產(chǎn)品能真正給大家?guī)?lái)那種珍貴的 aha moment,語(yǔ)音輸入產(chǎn)品 Wispr Flow 就是其中之一。這個(gè)產(chǎn)品是我認(rèn)為第一個(gè)能讓用戶真正感受到語(yǔ)音作為輸入界面,產(chǎn)生 aha momen 的產(chǎn)品。尤其是最近看到很多朋友體驗(yàn)后都表示,不用打字之后,能通過(guò)自然語(yǔ)言像和人交流一樣的方式輸入,那種爽感是真實(shí)的。

今年二月我和創(chuàng)始人 Tanay Kothari 交流,發(fā)現(xiàn)他其實(shí)對(duì)語(yǔ)音交互和產(chǎn)品設(shè)計(jì)有很深的思考,會(huì)從神經(jīng)科學(xué)和設(shè)計(jì)哲學(xué)的角度去探索更深層的"為什么"。在那次對(duì)話之后我也很佩服他,在硅谷這么多技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)公司里,像他這樣既懂技術(shù)又真正關(guān)注用戶體驗(yàn)、有產(chǎn)品 sense 的創(chuàng)始人并不多。

作為同樣在語(yǔ)音賽道的創(chuàng)業(yè)者,我個(gè)人覺(jué)得從硅谷這邊來(lái)看,語(yǔ)音 AI 還處于技術(shù)創(chuàng)新的非常早期階段。它就像重寫所有的 APP 一樣,會(huì)在交互輸入層面重塑現(xiàn)在大多數(shù)產(chǎn)品的體驗(yàn)。目前語(yǔ)音 AI 整體創(chuàng)業(yè)的進(jìn)展是先從基礎(chǔ)設(shè)施層出發(fā),比如 speech-to-text、real-time voice conversation 這些,然后再進(jìn)入到應(yīng)用層的產(chǎn)品。

然而,語(yǔ)音這種輸入界面的方式對(duì)于人們使用產(chǎn)品的習(xí)慣影響是慢慢滲透的,在應(yīng)用產(chǎn)品層正在逐漸出現(xiàn)聚焦各種細(xì)分賽道的語(yǔ)音應(yīng)用。從 OpenAI 的 Advanced Voice Mode 讓我們第一次體驗(yàn)到真正的 AI 對(duì)話,到 Google 的 NotebookLM 用雙人播客重新定義信息消費(fèi),再到語(yǔ)音輸入的 Wispr Flow、情感陪伴的 Tolan、會(huì)議記錄的 Granola 等產(chǎn)品在不同場(chǎng)景的探索——語(yǔ)音正在成為一個(gè)穩(wěn)定的接口,擴(kuò)寬人們與產(chǎn)品交互的物理邊界。

前幾周,Wispr Flow 宣布完成了 Menlo Ventures 領(lǐng)投的 3000 萬(wàn)美元 A 輪融資,這篇文章分享一下我和 Tanay 聊的一些觀點(diǎn),以及關(guān)于語(yǔ)音產(chǎn)品設(shè)計(jì)的思考。

1

一、Wispr Flow:比打字快 4 倍的語(yǔ)音輸入

Wispr Flow 是一款語(yǔ)音轉(zhuǎn)文字應(yīng)用,核心功能是讓用戶在任何應(yīng)用內(nèi)都能通過(guò)語(yǔ)音進(jìn)行輸入。不管你是在寫郵件、發(fā) Slack 消息、寫文檔,還是和 ChatGPT 對(duì)話,都可以用說(shuō)話代替打字。產(chǎn)品支持 104 種語(yǔ)言,并且會(huì)根據(jù)不同應(yīng)用場(chǎng)景自動(dòng)調(diào)整語(yǔ)調(diào)和格式。

團(tuán)隊(duì)背景


創(chuàng)始人 Tanay Kothari 擁有斯坦福大學(xué)計(jì)算機(jī)科學(xué)學(xué)士學(xué)位,曾在 Andrew Ng 指導(dǎo)下進(jìn)行 AI 研究。9 歲開(kāi)始編程,20 歲時(shí)創(chuàng)立的第一家公司 FeatherX 在一年內(nèi)被收購(gòu)。

聯(lián)合創(chuàng)始人兼 CTO Sahaj Garg 同樣來(lái)自斯坦福,曾在 Google Brain 進(jìn)行 NLP 和機(jī)器學(xué)習(xí)公平性研究,在 Luminous Computing 擔(dān)任 AI 團(tuán)隊(duì)負(fù)責(zé)人。

產(chǎn)品發(fā)展時(shí)間線

Wispr AI 成立于 2021 年 8 月,最初想做通過(guò)識(shí)別無(wú)聲口型來(lái)打字的可穿戴設(shè)備。

- 2023 年轉(zhuǎn)向軟件,開(kāi)發(fā) Wispr Flow 應(yīng)用

- 2024 年 10 月發(fā)布 Mac 版本

- 2025 年 3 月推出 Windows 版本

- 2025 年 6 月發(fā)布 iOS 應(yīng)用并在 Product Hunt 獲得第一名


目前產(chǎn)品的用戶增長(zhǎng)率達(dá)到月環(huán)比 50%,收入增長(zhǎng)月環(huán)比 60%,付費(fèi)轉(zhuǎn)化率 19%,年收入 380 萬(wàn)美元。據(jù) Tanay 透露,硅谷幾乎每一家一線風(fēng)投基金都在使用 Wispr Flow 處理郵件、備忘錄和文檔,"他們感到被這個(gè)產(chǎn)品吸引住了,這是他們每天都在使用的產(chǎn)品之一",我自己也是產(chǎn)品的日活用戶。

有體驗(yàn)過(guò)的朋友會(huì)更認(rèn)可這一點(diǎn),語(yǔ)音輸入一旦進(jìn)入的 flow 其實(shí)很難再回到打字狀態(tài),這也是為什么我自己和身邊做語(yǔ)音產(chǎn)品的朋友一直也越來(lái)越相信“語(yǔ)音作為一種新的產(chǎn)品交互媒介”的原因。

1

二、對(duì)話 Tanay:深入 Voice AI 的設(shè)計(jì)哲學(xué)

二月份我與 Tanay 進(jìn)行了一次深度對(duì)話,那次交流印象極深,不僅僅是 Wispr Flow 這一產(chǎn)品的設(shè)計(jì)理念和技術(shù)實(shí)現(xiàn),還有很多是彼此同作為語(yǔ)音產(chǎn)品的早期探索者,對(duì)于 Voice Interface 語(yǔ)音界面這一全新交互方式的一些思考和共鳴。以下是對(duì)話的核心內(nèi)容:

Vela: Why is the product called "Flow"?

Tanay: The name "Flow" captures the essence of the product's design philosophy—enabling users to enter a natural, uninterrupted rhythm while speaking, listening, and completing tasks. The interface avoids distractions and cognitive overload, allowing users to focus entirely on their interactions without being interrupted by unnecessary visual or technical elements.

Vela:為什么產(chǎn)品叫"Flow"?

Tanay:"Flow"這個(gè)名字體現(xiàn)了產(chǎn)品設(shè)計(jì)理念的精髓——讓用戶在說(shuō)話、聽(tīng)取和完成任務(wù)時(shí)進(jìn)入一種自然、不中斷的節(jié)奏。界面避免干擾和認(rèn)知過(guò)載,使用戶能夠?qū)W⒂诨?dòng),而不被不必要的視覺(jué)或技術(shù)元素打斷。

一些思考:

這里體現(xiàn)的是心理學(xué)家 Mihály Csíkszentmihályi 的"心流"理論在產(chǎn)品設(shè)計(jì)中的具體應(yīng)用。在我自己構(gòu)建語(yǔ)音產(chǎn)品的過(guò)程中,我深刻體會(huì)到"Flow"狀態(tài)對(duì)用戶體驗(yàn)的重要性。用戶在使用語(yǔ)音輸入時(shí),任何界面上的干擾都會(huì)打斷思維的連貫性。

這一設(shè)計(jì)理念讓我想起了之前分析過(guò)的 Suno 的產(chǎn)品哲學(xué)——技術(shù)的最高境界是讓用戶感受不到技術(shù)的存在。當(dāng)我們?cè)谠O(shè)計(jì)語(yǔ)音界面時(shí),如何在提供必要反饋的同時(shí)不打斷用戶的思維流,這是一個(gè)需要精心平衡的設(shè)計(jì)挑戰(zhàn)。

Vela: What is the goal of the voice interface?

Tanay: The voice interface is designed to become an indispensable tool in users' lives by replacing traditional devices like phones and laptops for 90% of daily tasks. The ultimate goal is to build a product that users trust and rely on, with seamless usability, personalization, and natural interactions as its core features. The long-term vision involves creating a dedicated hardware device that integrates the voice interface into users' lives, allowing them to perform tasks like communication, task management, and information retrieval effortlessly through voice commands. This vision emphasizes the shift from screen-based to voice-first interactions, making technology more intuitive and accessible.

Vela:為什么做語(yǔ)音界面?

Tanay:語(yǔ)音界面旨在成為用戶生活中不可或缺的工具,通過(guò)替代傳統(tǒng)設(shè)備(如手機(jī)和筆記本電腦)完成 90% 的日常任務(wù)。最終目標(biāo)是打造一個(gè)用戶可以信任和依賴的產(chǎn)品,其核心功能包括無(wú)縫的可用性、個(gè)性化和自然的交互。長(zhǎng)期愿景是創(chuàng)建一個(gè)專用的硬件設(shè)備,將語(yǔ)音界面無(wú)縫集成到用戶的生活中,使他們能夠通過(guò)語(yǔ)音命令輕松完成通信、任務(wù)管理和信息檢索等任務(wù)。從基于屏幕的交互轉(zhuǎn)向語(yǔ)音優(yōu)先的交互,讓技術(shù)更加直觀和易用。

一些思考:

在中提到過(guò),我認(rèn)為語(yǔ)音正在成為一個(gè)較穩(wěn)定的接口擴(kuò)寬人們與產(chǎn)品交互的物理邊界,而 Tanay 提到的"替代 90% 日常任務(wù)"不是簡(jiǎn)單的功能替換,而是交互方式的重新定義。

語(yǔ)音交互的最大價(jià)值在于它解放了用戶的手和眼睛,讓多任務(wù)處理成為可能。但要實(shí)現(xiàn)這個(gè)愿景,關(guān)鍵在于如何處理語(yǔ)音交互中的錯(cuò)誤和模糊性,比如在人們?nèi)粘Uf(shuō)話中有很多話是沒(méi)有必要的,但又有一些很重要(nuance),所以如果作為一種從聽(tīng)寫的交互看,不必要逐字逐句聽(tīng)寫,但又要弄明白用戶意圖、什么是重要的?——這正是 Wispr Flow 通過(guò)"零編輯"這一目標(biāo)要解決的核心問(wèn)題。

Vela: When talking about voice interface design, all of us are pretty new to this field. What is the product design philosophy when building the flow?

Tanay: The product is designed with a user-first, emotion-based philosophy, emphasizing how interactions make users feel rather than focusing solely on technical performance.

- Emotion-Based Design: The design aims to elicit positive emotions and reduce frustration, creating a delightful and intuitive user experience.

- User-Centric Focus: Moving away from overly technical, developer-oriented designs to prioritize the needs and behaviors of end-users.

- Flow-Oriented Interface: The product ensures a seamless, uninterrupted experience by aligning with how users naturally interact with technology.

For example: - Avoiding real-time text display during speech to reduce cognitive interference (based on neuroscience research). - Displaying text during pauses to help users process information more effectively. - Learning from user corrections to build a personalized dictionary and continuously improve accuracy.

Vela:產(chǎn)品的設(shè)計(jì)理念是什么?

Tanay:用戶優(yōu)先、基于情感,強(qiáng)調(diào)互動(dòng)如何讓用戶感到愉悅,而不僅僅關(guān)注技術(shù)性能。

基于情感的設(shè)計(jì):設(shè)計(jì)旨在激發(fā)積極情緒,減少挫敗感,創(chuàng)造令人愉悅且直觀的用戶體驗(yàn)。

以用戶為中心:摒棄過(guò)于技術(shù)化、面向開(kāi)發(fā)者的設(shè)計(jì),優(yōu)先考慮最終用戶的需求和行為。

Flow 流暢界面:產(chǎn)品通過(guò)與用戶自然的技術(shù)互動(dòng)方式相一致,確保無(wú)縫、不中斷的體驗(yàn)。例如:

- 避免在語(yǔ)音過(guò)程中實(shí)時(shí)顯示文本,以減少認(rèn)知干擾(基于神經(jīng)科學(xué)研究)。

- 在暫停時(shí)顯示文本,幫助用戶更有效地處理信息。

- 從用戶的糾正中學(xué)習(xí),建立個(gè)性化詞典并不斷提高準(zhǔn)確性。


一些思考:

"情感優(yōu)先設(shè)計(jì)哲學(xué)"這一點(diǎn)值得思考。在我自己構(gòu)建語(yǔ)音產(chǎn)品的過(guò)程中,我發(fā)現(xiàn)技術(shù)指標(biāo)和用戶體驗(yàn)之間往往存在微妙的平衡。傳統(tǒng)的語(yǔ)音識(shí)別產(chǎn)品過(guò)分關(guān)注 WER(詞錯(cuò)誤率),但用戶真正在意的是能否"零編輯"地使用輸出結(jié)果。

就像當(dāng)時(shí)分析 時(shí)發(fā)現(xiàn)的一個(gè)重要洞察:最好的 AI 產(chǎn)品不是炫耀技術(shù),而是讓技術(shù)消失在用戶體驗(yàn)中。Wispr Flow 通過(guò)基于神經(jīng)科學(xué)的界面時(shí)序設(shè)計(jì),體現(xiàn)了對(duì)用戶認(rèn)知過(guò)程的深度理解——這正是我認(rèn)為語(yǔ)音產(chǎn)品與傳統(tǒng) GUI 產(chǎn)品最大的差異。

Vela: What neuroscience insight influenced the design?

Tanay: Neuroscience research revealed that speaking and reading activate the same brain region responsible for language understanding. This overlap makes it challenging for users to do both simultaneously. To address this, the product avoids displaying real-time text during speech, reducing cognitive interference. Instead, text appears during pauses, aligning with how the brain processes language and allowing users to reflect on their output more effectively.

Vela:神經(jīng)科學(xué)的哪些見(jiàn)解影響了設(shè)計(jì)?

Tanay:神經(jīng)科學(xué)研究表明,說(shuō)話和閱讀會(huì)激活同一個(gè)負(fù)責(zé)語(yǔ)言理解的大腦區(qū)域。這種重疊使用戶難以同時(shí)完成兩項(xiàng)任務(wù)。為了解決這一問(wèn)題,產(chǎn)品在語(yǔ)音過(guò)程中避免顯示實(shí)時(shí)文本,從而減少認(rèn)知干擾。相反,文本在暫停時(shí)顯示,與大腦處理語(yǔ)言的方式保持一致,使用戶能夠更有效地反思輸出內(nèi)容。

一些思考:

一個(gè)啟發(fā)點(diǎn),在設(shè)計(jì)語(yǔ)音界面時(shí),我們往往本能地想要提供實(shí)時(shí)反饋,比如其他的同類語(yǔ)音輸入產(chǎn)品 Aqua、Superwhisper 是這樣做的,但 Tanay 提到的這一點(diǎn)值得我們?cè)谠O(shè)計(jì)產(chǎn)品時(shí)從用戶體驗(yàn)而不是技術(shù)角度出發(fā)來(lái)思考問(wèn)題。

認(rèn)知負(fù)載理論將人腦處理信息的負(fù)荷分為三類:內(nèi)在負(fù)載(任務(wù)本身的復(fù)雜性)、外在負(fù)載(呈現(xiàn)方式造成的額外負(fù)荷)、以及有效負(fù)載(促進(jìn)學(xué)習(xí)和理解的負(fù)荷)。從認(rèn)知負(fù)載的角度來(lái)看,Wispr Flow 通過(guò)將復(fù)雜的 AI 處理過(guò)程完全后臺(tái)化來(lái)優(yōu)化內(nèi)在負(fù)載,通過(guò)精心設(shè)計(jì)的界面時(shí)序來(lái)消除外在負(fù)載,通過(guò)個(gè)性化學(xué)習(xí)來(lái)增強(qiáng)有效負(fù)載。

Vela: How does personalization work in the product?

Tanay: Personalization is a cornerstone of the product, achieved through advanced modeling that adapts to each user's unique preferences, behaviors, and communication styles. Key elements include:

- Tone and Style Adaptation: The system learns how users communicate in different contexts (e.g., casual with friends, formal with colleagues, warm with family) and adjusts the tone, language, and structure of responses accordingly.

- Emoji and Phrase Integration: It incorporates contextual elements like emojis or specific phrases that align with the user's habits, making interactions feel more natural and human-like.

- Continuous Learning: The system learns from user corrections (e.g., adjusting transcriptions or adding new words to the dictionary) to refine its performance over time.

- Multi-Language Support: Personalization extends across languages, ensuring consistency in tone and style when users switch languages.

This level of personalization ensures the product feels intuitive, tailored, and responsive to each individual's needs.

Vela:Wispr Flow 是怎么做語(yǔ)音輸入的“個(gè)性化的”?

Tanay:個(gè)性化是產(chǎn)品的基石,通過(guò)高級(jí)建模實(shí)現(xiàn),能夠適應(yīng)每位用戶的獨(dú)特偏好、行為和溝通風(fēng)格。關(guān)鍵要素包括:

語(yǔ)氣和風(fēng)格調(diào)整:系統(tǒng)會(huì)學(xué)習(xí)用戶在不同情境下的溝通方式(例如,與朋友的隨意交流、與同事的正式溝通、與家人的溫暖交流),并相應(yīng)地調(diào)整語(yǔ)氣、語(yǔ)言和回復(fù)結(jié)構(gòu)。

表情符號(hào)和短語(yǔ)集成:它會(huì)根據(jù)用戶習(xí)慣集成上下文元素,如表情符號(hào)或特定短語(yǔ),使互動(dòng)更自然、更人性化。

持續(xù)學(xué)習(xí):系統(tǒng)從用戶的糾正中學(xué)習(xí)(例如,調(diào)整轉(zhuǎn)錄或添加新詞到詞典),隨著時(shí)間推移不斷優(yōu)化性能。

多語(yǔ)言支持:個(gè)性化功能擴(kuò)展到多種語(yǔ)言,確保用戶在切換語(yǔ)言時(shí)語(yǔ)氣和風(fēng)格的一致性。


個(gè)性化機(jī)制其實(shí)正是 AI 產(chǎn)品的”護(hù)城河“,關(guān)鍵在于是否有足夠有效的用戶信息。

Vela: What is the roadmap for flow in terms of voice interface?

Tanay:

1. Perfect Speech-to-Text Functionality: Establishing a highly accurate, reliable foundation for real-time transcription and speech recognition.

2. Personalization and User-Specific Models: Building sophisticated models that adapt to individual users' preferences, communication styles, and unique vocabularies.

3. Actions and Workflow Capabilities: Introducing features like smart reminders, email/message automation, and workflow integration to enhance productivity and convenience.

4. Dedicated Hardware Device: The long-term vision includes creating a wearable device that replaces 90% of phone and laptop usage, allowing users to perform most tasks seamlessly through voice commands.

Vela:怎么看 Flow 發(fā)展的產(chǎn)品路線圖?

Tanay:

1. 完善語(yǔ)音轉(zhuǎn)文字功能:建立一個(gè)高度準(zhǔn)確且可靠的實(shí)時(shí)轉(zhuǎn)錄和語(yǔ)音識(shí)別基礎(chǔ)。

2. 個(gè)性化和用戶特定模型:構(gòu)建復(fù)雜的模型,能夠適應(yīng)每位用戶的偏好、溝通風(fēng)格和獨(dú)特詞匯。

3. 動(dòng)作和工作流功能:引入智能提醒、電子郵件/消息自動(dòng)化和工作流集成功能,提升生產(chǎn)力和便利性。

4. 專用硬件設(shè)備:長(zhǎng)期愿景包括創(chuàng)建一個(gè)可穿戴設(shè)備,替代 90% 的手機(jī)和筆記本電腦使用,通過(guò)語(yǔ)音命令無(wú)縫完成大部分任務(wù)。

一些思考

先在軟件層面做到極致,再考慮硬件承載,其實(shí)這一路線比他們一開(kāi)始直接做硬件以及很多做語(yǔ)音硬件產(chǎn)品更為現(xiàn)實(shí)。

而 Tanay 提到的第三階段提到的"動(dòng)作和工作流功能",是語(yǔ)音產(chǎn)品區(qū)別于傳統(tǒng)輸入工具的關(guān)鍵——從被動(dòng)的轉(zhuǎn)錄變成主動(dòng)的行動(dòng)助理。就像Granola,不僅僅是一個(gè)會(huì)議聽(tīng)寫記筆記工具,它還會(huì)在會(huì)議開(kāi)始前提醒你將要到來(lái)的回會(huì)議,并在會(huì)議結(jié)束后為你撰寫一封必要的郵件。

Get things done.

同時(shí),值得一提的是,在新功能正式發(fā)布前, Flow 團(tuán)隊(duì)首先會(huì)在內(nèi)部進(jìn)行大量的 Beta 測(cè)試。這使團(tuán)隊(duì)能夠觀察實(shí)際使用情況,識(shí)別問(wèn)題,并根據(jù)反饋對(duì)功能進(jìn)行優(yōu)化,然后再發(fā)布給外部用戶。確保新功能以用戶為中心、可靠且經(jīng)過(guò)完善。

1

三、寫在最后,關(guān)于 AI 產(chǎn)品設(shè)計(jì)

從 Wispr Flow 可以很好地看出一個(gè)關(guān)注產(chǎn)品本身、且具有”產(chǎn)品Sense“的一個(gè) AI 產(chǎn)品是怎樣被創(chuàng)造出來(lái)的。而對(duì)于 Voice AI Interface 這一全新的交互,對(duì)于所有創(chuàng)業(yè)者來(lái)說(shuō)都是一種全新的體驗(yàn)的探索。創(chuàng)造 Voice Interface 的思考可以遷移到對(duì) Voice AI 的構(gòu)建中:

第一,用戶體驗(yàn)重于技術(shù)指標(biāo)。 傳統(tǒng)的語(yǔ)音識(shí)別產(chǎn)品追求準(zhǔn)確率,但 Wispr Flow 追求的是"零編輯"的用戶體驗(yàn)。這個(gè)差異看似微小,實(shí)則代表了完全不同的產(chǎn)品哲學(xué)。

核心是從用戶角度出發(fā),什么是你希望帶給用戶的一種好的用戶體驗(yàn)?很多第一次體驗(yàn)語(yǔ)音輸入的朋友都表示,“啊不用打字只需要blabla且不用擔(dān)心說(shuō)廢話真爽”,就像很多第一次體驗(yàn)會(huì)議記錄產(chǎn)品 Granola 的用戶說(shuō) “啊,不用再擔(dān)心錄音、丟掉會(huì)議信息的感覺(jué)真爽”“而自己只需要記錄自己覺(jué)得核心的東西,其他的事情交給 Granola 很放心”。

第二,相信科學(xué),忠于用戶。Wispr Flow 語(yǔ)音輸入背后是基于神經(jīng)科學(xué)研究:人在說(shuō)話時(shí)大腦是怎么運(yùn)作的?我們是否可以同時(shí)說(shuō)話、傾聽(tīng)、記筆記?然而,優(yōu)秀的產(chǎn)品也同樣極其關(guān)注用戶,關(guān)注產(chǎn)品背后真實(shí)的人與用戶故事。

第三,個(gè)性化(Personization)是 AI 產(chǎn)品的核心競(jìng)爭(zhēng)力。 在人人都可以用大模型捏一個(gè)產(chǎn)品的時(shí)代,真正的護(hù)城河不在于模型本身,而在于對(duì)用戶的深度理解、用戶知識(shí)沉淀和個(gè)性化能力。

我很喜歡 Flow 這款產(chǎn)品,很欣賞 Tanay,就像自己剛來(lái)硅谷和 Suno 交流一樣,Tanay 也 像極了 Suno 的創(chuàng)始人 Mikey,他們有著及其相似的 vibe, 一樣的對(duì)做創(chuàng)造產(chǎn)品的熱忱、和對(duì)于產(chǎn)品設(shè)計(jì)近乎極致的追求。

在語(yǔ)音 AI 逐漸發(fā)展的今天,Wispr Flow 的出現(xiàn)給大家?guī)?lái)的 Voice-First 體驗(yàn)的 Aha moment。正如我在之前的文章中提到的,"語(yǔ)音正在成為一個(gè)較穩(wěn)定的接口擴(kuò)寬人們與產(chǎn)品交互的物理邊界"。

我相信我們正站在一個(gè)重要的歷史節(jié)點(diǎn)。Voice-first 不僅僅是一種技術(shù)趨勢(shì),更是一種重新定義人機(jī)交互與重塑的機(jī)會(huì)。

對(duì)于 Voice- AI,其實(shí)一切都才剛剛開(kāi)始。

黎明破曉,我們都在路上。


Pride Month at Ferry Building, SF, June 28th

Wispr Flow 產(chǎn)品體驗(yàn)(免費(fèi)適用)

https://wisprflow.ai/

點(diǎn)個(gè)愛(ài)心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1975年,甘肅5個(gè)孩子在大佛寺玩,一孩童藏身佛像時(shí)發(fā)現(xiàn)一道暗門

1975年,甘肅5個(gè)孩子在大佛寺玩,一孩童藏身佛像時(shí)發(fā)現(xiàn)一道暗門

南權(quán)先生
2025-07-14 12:01:54
湖南一女子因長(zhǎng)得太漂亮,55歲沒(méi)上過(guò)一天班,顏值曝光后網(wǎng)友懵了

湖南一女子因長(zhǎng)得太漂亮,55歲沒(méi)上過(guò)一天班,顏值曝光后網(wǎng)友懵了

來(lái)科點(diǎn)譜
2025-07-20 09:06:53
南海明明有巨量石油,多國(guó)都在偷偷盜挖,我國(guó)卻到處買油,為何

南海明明有巨量石油,多國(guó)都在偷偷盜挖,我國(guó)卻到處買油,為何

鐵錘簡(jiǎn)科
2025-07-17 15:20:33
不給殲20就放棄殲-35?中方態(tài)度堅(jiān)定,沒(méi)有商量余地

不給殲20就放棄殲-35?中方態(tài)度堅(jiān)定,沒(méi)有商量余地

一個(gè)有靈魂的作者
2025-07-18 10:41:40
鄭欽文新參賽計(jì)劃出爐!退出蒙特利爾,9月出戰(zhàn)比利簡(jiǎn)金杯總決賽

鄭欽文新參賽計(jì)劃出爐!退出蒙特利爾,9月出戰(zhàn)比利簡(jiǎn)金杯總決賽

排球黃金眼
2025-07-22 00:32:32
知名女演員突患重病,放化療25次!曾四登春晚

知名女演員突患重病,放化療25次!曾四登春晚

大象新聞
2025-07-21 11:52:42
江西富豪遭滅門,侄子裝死幸存,12年后說(shuō)出真相警方傻眼:咋是他

江西富豪遭滅門,侄子裝死幸存,12年后說(shuō)出真相警方傻眼:咋是他

罪案洞察者
2025-07-09 11:53:28
阿里小號(hào)將全網(wǎng)停服!有10年老用戶綁定數(shù)百個(gè)賬號(hào)

阿里小號(hào)將全網(wǎng)停服!有10年老用戶綁定數(shù)百個(gè)賬號(hào)

鞭牛士
2025-07-21 17:16:29
記者:阿森納想分四期支付哲凱賴什轉(zhuǎn)會(huì)費(fèi),葡體要求加120萬(wàn)歐

記者:阿森納想分四期支付哲凱賴什轉(zhuǎn)會(huì)費(fèi),葡體要求加120萬(wàn)歐

雷速體育
2025-07-22 00:22:10
“我全家決定加你名,但房貸你來(lái)還”女友:不需要,我自己買了房

“我全家決定加你名,但房貸你來(lái)還”女友:不需要,我自己買了房

廣西秦胖胖
2025-07-21 22:43:43
從長(zhǎng)征到解放戰(zhàn)爭(zhēng),幾乎不見(jiàn)朱德身影,他憑什么是十大元帥之首?

從長(zhǎng)征到解放戰(zhàn)爭(zhēng),幾乎不見(jiàn)朱德身影,他憑什么是十大元帥之首?

仆街貓歷史
2025-06-10 16:50:41
為何秦始皇母親趙姬,一見(jiàn)到嫪?dú)本蛢赏人周洠克抉R遷揭開(kāi)三字真相

為何秦始皇母親趙姬,一見(jiàn)到嫪?dú)本蛢赏人周洠克抉R遷揭開(kāi)三字真相

談史論天地
2025-06-25 15:25:02
即日起,廣州正式進(jìn)入!最難熬的 30 天來(lái)了!還有一個(gè)壞消息……

即日起,廣州正式進(jìn)入!最難熬的 30 天來(lái)了!還有一個(gè)壞消息……

羊城攻略
2025-07-21 16:43:38
明日開(kāi)播!三部新劇同天定檔,懸疑or復(fù)仇or商戰(zhàn),你打算追哪部?

明日開(kāi)播!三部新劇同天定檔,懸疑or復(fù)仇or商戰(zhàn),你打算追哪部?

影視快通車
2025-07-21 11:52:56
國(guó)米恰恰父子是真卑鄙,穆里尼奧下場(chǎng)砍價(jià),卻是加拉塔薩雷來(lái)付款

國(guó)米恰恰父子是真卑鄙,穆里尼奧下場(chǎng)砍價(jià),卻是加拉塔薩雷來(lái)付款

穆里尼奧主義者
2025-07-21 21:54:51
李在明先斬后奏,尹錫悅被折磨得奄奄一息,卻等來(lái)了個(gè)最壞的消息

李在明先斬后奏,尹錫悅被折磨得奄奄一息,卻等來(lái)了個(gè)最壞的消息

肖茲探秘說(shuō)
2025-07-21 18:16:12
烏克蘭收復(fù)扎波羅熱南部多地!完全控制蘇梅的金德拉蒂夫卡

烏克蘭收復(fù)扎波羅熱南部多地!完全控制蘇梅的金德拉蒂夫卡

項(xiàng)鵬飛
2025-07-20 21:40:34
國(guó)產(chǎn)啤酒,為什么越來(lái)越難喝了?

國(guó)產(chǎn)啤酒,為什么越來(lái)越難喝了?

簡(jiǎn)食記工作號(hào)
2025-07-22 00:22:44
超性感的“人間水密桃”,一張襯衫真空照撩瘋了…

超性感的“人間水密桃”,一張襯衫真空照撩瘋了…

書畫藝術(shù)收藏
2025-07-22 00:04:44
這才是杜月笙孟小冬真實(shí)樣貌,并非演員扮演,貨真價(jià)實(shí)的珍貴照片

這才是杜月笙孟小冬真實(shí)樣貌,并非演員扮演,貨真價(jià)實(shí)的珍貴照片

淼犇小牛
2025-07-14 20:41:44
2025-07-22 01:28:49
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來(lái)的基礎(chǔ),歡迎來(lái)到這個(gè)星球。
2351文章數(shù) 10352關(guān)注度
往期回顧 全部

科技要聞

劉強(qiáng)東闊氣出手!兩月投了4家具身智能公司

頭條要聞

男子為終身質(zhì)保花60萬(wàn)買蔚來(lái) 1年跑17萬(wàn)公里權(quán)益沒(méi)了

頭條要聞

男子為終身質(zhì)保花60萬(wàn)買蔚來(lái) 1年跑17萬(wàn)公里權(quán)益沒(méi)了

體育要聞

這四位大兄弟,你們真敢要3000萬(wàn)吶

娛樂(lè)要聞

五哈全員為寶石老舅送祝福

財(cái)經(jīng)要聞

炒港美股"補(bǔ)稅潮"突襲?一文了解始末

汽車要聞

勞斯萊斯前設(shè)計(jì)師全新力作 榮威M7正式亮相

態(tài)度原創(chuàng)

時(shí)尚
親子
游戲
教育
家居

二搭的風(fēng)正在吹向你的CP

親子要聞

看這小孩調(diào)皮的想上窗臺(tái),媳婦炒幾個(gè)菜給公婆送,炒蘑菇太好吃啦

《火焰紋章》新作正在開(kāi)發(fā)?模型師領(lǐng)英現(xiàn)端倪!

教育要聞

清華直通!7名學(xué)霸被保送,一中、南外、金中河西的學(xué)霸上榜!

家居要聞

別樣老上海 重塑復(fù)古優(yōu)雅

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 尉犁县| 汝南县| 久治县| 黄平县| 舒城县| 商洛市| 海盐县| 吴堡县| 乐清市| 垫江县| 台北县| 昌乐县| 柯坪县| 贵溪市| 赞皇县| 台安县| 绵阳市| 沙雅县| 孝义市| 广饶县| 巨鹿县| 祁东县| 霍林郭勒市| 河南省| 青龙| 长岭县| 滨海县| 莱阳市| 乌兰察布市| 开平市| 郸城县| 扶沟县| 乾安县| 石家庄市| 勃利县| 辽中县| 吉林市| 平泉县| 栾城县| 梓潼县| 永定县|