Năm nay, các khả năng cơ bản của các mô hình lớn đã có một bước nhảy vọt khác, và các công cụ AI như ChatGPT, DeepSeek và Doubao đang trở thành những trợ lý phổ biến cho một số lượng ngày càng tăng các chuyên gia trong nơi làm việc.
Năng lực của những AI này thực sự rất mạnh mẽ, nhưng cũng có một ngưỡng đáng kể: để khiến chúng "hoạt động", thường cần phải chuẩn bị rất nhiều tài liệu trước. Nói cách khác, AI ngày nay giống như những tư vấn viên có IQ cao, trong khi từ góc độ cải thiện hiệu quả thực tế, điều chúng ta thực sự cần là một "trợ lý thông minh" ở bên cạnh, giúp tôi ghi lại thông tin và đưa ra nhắc nhở cũng như phản hồi vào những thời điểm quan trọng.
Mobvoi đang cố gắng lấp đầy khoảng trống này. Vào tháng Tư, công ty lần đầu tiên ra mắt sản phẩm phần cứng AI Agentic đầu tiên trên thế giới, TicNote. Vào ngày 25 tháng 6, phần cứng này đã chính thức ra mắt tại thị trường trong nước. Tại sự kiện ra mắt, người sáng lập Mobvoi, Lý Chí Phong, nhấn mạnh rằng đây không chỉ là một máy ghi âm, một thiết bị dịch thuật hay một trợ lý giọng nói, mà là một "đối tác tư duy AI cá nhân."
Trước khi hỏi về lối thoát, một số công ty cả trong nước và quốc tế đã cố gắng kết hợp các mô hình lớn với phần cứng ghi âm, nhưng hầu hết vẫn coi AI là một công cụ để xử lý thông tin âm thanh, chủ yếu sử dụng nó để tổ chức ghi chú cuộc họp hoặc cho mục đích dịch thuật. Mặc dù TicNote có khả năng tương tự, nhưng định vị của nó vượt ra ngoài điều đó. Bằng cách liên tục ghi lại thông tin về công việc và cuộc sống của người dùng, TicNote hiệu quả trở thành một "trợ lý siêu cấp" đi kèm với người dùng 24/7, chủ động cung cấp cảm hứng làm việc và những hiểu biết dựa trên nội dung giao tiếp hàng ngày và khả năng suy luận của các mô hình lớn.
Là một "người bạn cũ" của Geek Park, chúng tôi đã chứng kiến toàn bộ hành trình của Out of the Door từ khởi nghiệp đến niêm yết, và trải nghiệm giai đoạn thu hẹp chiến lược theo hướng các mô hình lớn. Giờ đây, Out of the Door đã chọn cách gia nhập lại đường đua mô hình lớn theo cách phần cứng. Quyết định này không đơn thuần là theo xu hướng hay bắt chước, mà là kết quả của nhiều năm tích lũy của người sáng lập Li Zhifei trong lĩnh vực tương tác giọng nói giữa người và máy. Trong khi thấy các con đường hiện có được xác nhận, ông cũng nhận thức được những khả năng sâu sắc hơn và hy vọng tạo ra những sản phẩm tốt hơn theo hướng này.
Hình dáng của TicNote giống như một viên sạc từ tính nhỏ, với độ dày khoảng 3 milimét, cho phép nó được gắn vào mặt sau của điện thoại một cách từ tính suốt cả ngày, gần như không gây ảnh hưởng đến việc sử dụng hàng ngày.
TicNote | Từ: Mobvoi
Khác với các máy ghi âm truyền thống, thiết kế dạng thẻ của TicNote hướng đến các tình huống "ghi âm mọi thời tiết" ngay từ đầu. Người dùng có thể dễ dàng điều khiển chế độ hoạt động ghi âm.
Hình thức phần cứng này không phải là sự sáng tạo của Out of the Box; những sản phẩm trước đây như Plaud Note cũng đã áp dụng một thiết kế tương tự. Ưu điểm của nó nằm ở khả năng hoạt động ổn định trong thời gian dài trong các tình huống yêu cầu ghi âm giọng nói lớn, chẳng hạn như giáo dục, truyền thông và lập kế hoạch sáng tạo, đồng thời tận dụng khả năng của các mô hình lớn để nâng cao hiệu quả của việc chuyển đổi, dịch và tóm tắt trong quá trình xử lý sau.
Kịch bản ứng dụng này đã đạt được một mức độ xác thực thị trường nhất định, nhưng Mobvoi tin rằng sự kết hợp giữa phần cứng ghi hình kiểu thẻ và các mô hình lớn chứa đựng tiềm năng lớn hơn chỉ là chức năng ghi âm và xử lý.
Ngoài các chức năng cơ bản như chuyển văn bản và tóm tắt, tính năng lớn nhất của TicNote là AI Agent tích hợp sẵn "Shadow AI". Nó hỗ trợ các cuộc trò chuyện thời gian thực, lập luận logic, tích hợp kiến thức và gợi ý viết, cho phép hiểu sâu hơn về nhu cầu sáng tạo nội dung của người dùng. Dù là trong công việc, học tập hay trong quá trình khám phá cảm hứng, nó có thể duy trì một cuộc đối thoại với người dùng, hỗ trợ hoàn thành nhiệm vụ và trở thành một trợ lý thông minh cá nhân.
Yolanda là một trong những người dùng beta của TicNote. Là một giám đốc công nghệ và là mẹ của một đứa trẻ đang chuẩn bị cho kỳ thi vào trung học, cô ấy thường phải đối mặt với những thách thức của thời gian bị phân mảnh và quá tải thông tin, khiến việc cân bằng giữa gia đình và công việc trở nên khó khăn. TicNote đã giúp cô giải quyết vấn đề này rất nhiều.
Một cuộc họp phụ huynh trực tuyến trùng với một cuộc họp đánh giá quan trọng của công ty, vì vậy Yolanda không thể quản lý cả hai cùng một lúc. Do đó, cô đã sử dụng TicNote để "vô hình" ghi lại toàn bộ nội dung cuộc họp phụ huynh, chính xác chuyển ngữ và tự động trích xuất các điểm chính sau đó, tổ chức chúng thành biên bản rõ ràng và một bản đồ tư duy, cho phép cô nắm bắt thông tin cuộc họp một cách toàn diện mà không cần phải phát lại.
Ngoài ra, Yolanda cũng đã yêu cầu các em mang TicNote đến mỗi buổi học bổ trợ. Đến cuối học kỳ, TicNote không chỉ ghi lại các điểm chính từ giáo viên mà còn giúp tóm tắt những điểm yếu của các em. Khi kỳ thi vào trung học phổ thông đến gần, các em đã sử dụng TicNote để tổ chức "bộ công cụ tại chỗ" và "phương pháp khẩn cấp" được giáo viên dạy, và kết hợp với những điểm yếu của mình để tạo thành tài liệu ôn tập rõ ràng.
Từ kinh nghiệm của Yolanda, có thể thấy rằng TicNote không chỉ là một công cụ ghi âm di động, mà thông qua thiết kế tích hợp giữa phần cứng và phần mềm kết hợp với khả năng của mô hình lớn, nó đang dần phát triển thành một trợ lý thông minh thực sự "hiểu bạn". Đằng sau một sản phẩm như vậy là sự cống hiến suốt một thập kỷ của Mobvoi trong lĩnh vực công nghệ giọng nói và tương tác giữa người với máy.
Sự ra mắt của TicNote bởi Mobvoi không phải là ngẫu nhiên. Con đường "tích hợp phần cứng-phần mềm + dịch vụ AI" mà sản phẩm này đại diện thực sự là một kết quả tự nhiên của việc Mobvoi tích lũy công nghệ và khám phá sản phẩm suốt một thập kỷ qua.
Kể từ khi thành lập vào năm 2012, Out of the Door đã xác định tương tác giọng nói giữa con người và máy móc là hướng đi cốt lõi, trở thành một trong những công ty đầu tiên ở Trung Quốc thực hành khái niệm "giọng nói đầu tiên". Ứng dụng trợ lý giọng nói tự phát triển ra mắt trong những ngày đầu tập trung vào nhận diện giọng nói tiếng Trung và hiểu ngôn ngữ tự nhiên. Trong những năm tiếp theo, công ty liên tục cố gắng tích hợp khả năng giọng nói vào phần cứng, lần lượt ra mắt các sản phẩm như đồng hồ thông minh TicWatch, gương chiếu hậu thông minh TicMirror và máy dịch TicTranslator, không ngừng khám phá các khả năng ứng dụng của việc kết hợp giọng nói với thiết bị.
Những sản phẩm này đã đứng đầu ngành vào thời điểm đó và tích lũy được kinh nghiệm kỹ thuật đáng kể. Tuy nhiên, những thách thức như ngưỡng sử dụng và chi phí của tương tác bằng giọng nói luôn cản trở nó trở thành phương thức hoạt động chính. Người dùng cần giao tiếp với các thiết bị thông qua từ đánh thức và ngôn ngữ lệnh, điều này dẫn đến chi phí tương tác cao và độ dung sai lỗi thấp, khiến việc xử lý các nhiệm vụ phức tạp trở nên khó khăn. Do đó, Mobvoi tạm thời thu hẹp danh mục sản phẩm phần cứng của mình và chuyển trọng tâm sang việc cải thiện khả năng AI.
Nhưng sự tiến hóa của tương tác giữa con người và máy tính chưa bao giờ thực sự bị từ bỏ bởi Mobvoi. Sự xuất hiện của kỷ nguyên các mô hình lớn đã mang lại những cơ hội mới cho tương tác giọng nói giữa con người và máy tính. Với sự cải thiện trong khả năng hiểu và tạo ra mô hình, cuộc đối thoại giữa con người và máy tính đã trở nên tự nhiên hơn, và ngày càng nhiều người dùng bắt đầu giao tiếp với AI theo cách trò chuyện. Giọng nói, như là phương thức tương tác gần gũi nhất với thói quen biểu đạt của con người, đã lấy lại giá trị của nó và được kỳ vọng trở thành một Gateway quan trọng kết nối AI với thế giới thực.
TicNote được ra mắt trong bối cảnh này. Nó không chỉ là một thiết bị thông minh để ghi chép mà còn liên tục tổ chức nội dung mà người dùng nghe và nói mỗi ngày thành thông tin có cấu trúc thông qua AI Agent tích hợp "Shadow AI", tạo ra một "cơ sở tri thức" cá nhân hóa cho mỗi cá nhân. Dựa trên cơ sở tri thức cá nhân hóa này, mô hình lớn không chỉ có thể được truy cập một cách hiệu quả mà còn có thể kết nối với mạng để khám phá giá trị của thông tin ở các chiều cao hơn.
Biểu mẫu sản phẩm này là một hiện thân tích hợp của sự tích lũy công nghệ đa chiều trong nhận diện giọng nói, hiểu ngôn ngữ tự nhiên và thiết kế thiết bị đầu cuối của Mobvoi. Lấy tính năng “Flash Chat” của TicNote làm ví dụ, người dùng có thể khởi đầu các cuộc trò chuyện bằng giọng nói bất cứ lúc nào trong quá trình ghi âm, nhanh chóng xem lại nội dung trước đó và trích xuất thông tin quan trọng, phù hợp cho các tình huống cần phản hồi ngay lập tức, chẳng hạn như phỏng vấn và họp. Mô hình tương tác “ghi lại và hỏi” này là kết quả của mười năm nỗ lực liên tục của Mobvoi trong công nghệ giọng nói.
Đồng thời, TicNote cũng có khả năng quản lý dự án tự động. Trong quá khứ, ngay cả các máy ghi âm giọng nói AI cũng thường bị giới hạn trong một kịch bản duy nhất, chỉ xử lý một đoạn nội dung duy nhất sau khi ghi âm. Tuy nhiên, trong logic tương tác của TicNote, tất cả dữ liệu đã ghi được được thống nhất thành một cơ sở kiến thức có thể mở rộng bền vững, cho phép người dùng gọi, tổ chức và tiếp tục các cuộc trò chuyện qua các kịch bản và thời gian khác nhau bất cứ lúc nào. Cách tổ chức thông tin này trực quan hơn cho người dùng cũng có nghĩa rằng TicNote không còn chỉ dành cho những người dùng chuyên nghiệp, mà còn có tính ứng dụng rộng rãi trong việc sử dụng hàng ngày.
Quan trọng hơn, lần này, Out of the Door không còn cố gắng "kiểm soát một máy" bằng giọng nói, mà thay vào đó là tận dụng khả năng của các mô hình lớn để làm cho giọng nói trở thành một điểm khởi đầu cho việc xây dựng tri thức và hỗ trợ thúc đẩy tư duy.
Nhìn lại, TicNote không chỉ là một bước ngoặt trong hướng công nghệ, mà còn giống như một sự hoàn thiện—nó tập hợp mọi bước đi của Out There Asking trong suốt thập kỷ qua, tập trung những kinh nghiệm rải rác trên nhiều cấp độ như tương tác giữa người và máy, thiết kế phần cứng, và dịch vụ AI vào một sản phẩm phù hợp hơn với thời đại này.
Hiện nay, ADHD đã trở thành một chủ đề xã hội nóng hổi. "Khó khăn trong việc tập trung" như một triệu chứng đang trở nên ngày càng phổ biến. Ngoài những bệnh nhân ADHD thực sự, ngày càng nhiều người bình thường bắt đầu nhận thấy những triệu chứng tương tự ở bản thân và thậm chí bắt đầu "tự chẩn đoán."
Điều này có rất nhiều liên quan đến việc quá tải thông tin khổng lồ mà chúng ta đang trải qua. Nhìn lại, nhân loại chưa bao giờ phải nhận và xử lý nhiều thông tin mỗi ngày như chúng ta hiện nay. Thông tin đổ vào mắt chúng ta không chỉ qua điện thoại mà còn tồn tại trong mọi tình huống trong cuộc sống của chúng ta. Chúng ta nhận quá nhiều thông tin mỗi ngày, và thời gian tồn tại của suy nghĩ của chúng ta đang ngày càng ngắn lại.
Một nhận thức phổ biến trong quá khứ là, so với lao động thể chất, lao động trí óc thì dễ dàng hơn, và việc ngồi trong văn phòng là một "đặc quyền" dành cho một số ít người, một mối quan tâm chung của mọi người. Tuy nhiên, bây giờ, ngày càng nhiều người tham gia vào công việc liên quan đến thông tin, nhưng lại cảm thấy mệt mỏi hoặc thậm chí chán nản với nó.
Chúng ta ngày càng nhận thức được rằng việc xử lý thông tin cũng là một gánh nặng có thể dẫn đến "mệt mỏi." Hiện tại, chúng ta cần giảm bớt gánh nặng cho não bộ của mình, giống như chúng ta thay thế lao động thủ công bằng các công cụ cơ khí. Những thiết bị như vậy phải có khả năng nhận thức, tương tác và hỗ trợ tư duy cùng cái nhìn sâu sắc, trở thành "cảm giác chính" và "bộ não phụ" của chúng ta.
Có thể đây là tham vọng tối thượng của TicNote và Out of the Door to Ask.
Hôm nay, phần lớn các sản phẩm AI đang cung cấp cho người dùng thông tin từ "góc độ một kịch bản đơn lẻ." Thực tế, tương lai tối thượng của AI nên có khả năng hỗ trợ người dùng trong việc quản lý toàn bộ trí nhớ và suy nghĩ của họ, bao gồm không chỉ thông tin và kiến thức mà còn cả những kỷ niệm. Hiện tại, ngành công nghiệp AI đã đề xuất khái niệm "dòng đời." Dòng đời đã được ghi lại về cơ bản là "kho trí nhớ" của chúng ta. Điều mà AI Agentic có thể làm là nâng cao kho trí nhớ này, khai thác những suy nghĩ và hiểu biết mà chúng ta thường không nhận thức được, từ đó giúp chúng ta giảm bớt gánh nặng khi tiếp nhận thông tin và khơi dậy nhiều cảm hứng hơn.
Trong tương lai gần, mỗi chúng ta sẽ cần một trợ lý có trí nhớ hoàn hảo và khả năng hỗ trợ chúng ta trong suy nghĩ, giúp chúng ta tổ chức lại thông tin mà chúng ta nhận được và mở rộng các chiều kích của tư duy. Tính năng "Khoảnh Khắc Eureka" tích hợp trong TicNote đã cung cấp một cái nhìn thoáng qua về tương lai này. Nó có thể cung cấp cho người dùng những góc nhìn AI về "những hiểu biết" dựa trên dữ liệu được người dùng lưu trữ.
Hiện tại, phần lớn các sản phẩm trợ lý AI được đào tạo dựa trên các tập hợp công khai có sẵn theo một nghĩa rộng, và chúng chủ yếu nhắm đến mục tiêu "toàn tri và toàn năng" trong việc đào tạo và phát triển. Tuy nhiên, điều mà nhiều người dùng thực sự cần hơn là một loại "AI cá nhân hóa". AI có khả năng này nên hiểu biết về kiến thức riêng tư của chúng ta nhiều hơn và cung cấp thông tin phù hợp với chúng ta, giúp chúng ta xây dựng những trải nghiệm cá nhân hóa.
Đối với Du Chumen Wenwen và Li Zhifei, TicNote không chỉ là một sự hiện thực hóa thành công các lý tưởng công nghệ của họ trong suốt mười hai năm qua mà còn là một khởi đầu mới hướng tới tương lai của AIGC. Họ đã đến một kỷ nguyên mới của sự tương tác giữa con người và máy tính, một kỷ nguyên của AIGC. TicNote không phải là một "đầu cơ" về mặt sản phẩm, mà thực sự là một đỉnh cao của một "cuộc tình" công nghệ dài hạn.
Vào tháng 4 năm ngoái, Công nghệ Out of the Door đã lên sàn chứng khoán, trở thành cổ phiếu AIGC đầu tiên tại Trung Quốc. Đối với Lý Trí Phong và đội ngũ của mình, việc giải quyết vấn đề "tiền" chưa bao giờ là điều quan trọng nhất; điều quan trọng hơn là họ có thể tinh chỉnh công nghệ mà họ kiên định tin tưởng đến trạng thái tốt nhất và sau đó mang nó đến với thế giới.
Bây giờ, nó đã tiến thêm một bước vững chắc nữa.
Năm nay, các khả năng cơ bản của các mô hình lớn đã có một bước nhảy vọt khác, và các công cụ AI như ChatGPT, DeepSeek và Doubao đang trở thành những trợ lý phổ biến cho một số lượng ngày càng tăng các chuyên gia trong nơi làm việc.
Năng lực của những AI này thực sự rất mạnh mẽ, nhưng cũng có một ngưỡng đáng kể: để khiến chúng "hoạt động", thường cần phải chuẩn bị rất nhiều tài liệu trước. Nói cách khác, AI ngày nay giống như những tư vấn viên có IQ cao, trong khi từ góc độ cải thiện hiệu quả thực tế, điều chúng ta thực sự cần là một "trợ lý thông minh" ở bên cạnh, giúp tôi ghi lại thông tin và đưa ra nhắc nhở cũng như phản hồi vào những thời điểm quan trọng.
Mobvoi đang cố gắng lấp đầy khoảng trống này. Vào tháng Tư, công ty lần đầu tiên ra mắt sản phẩm phần cứng AI Agentic đầu tiên trên thế giới, TicNote. Vào ngày 25 tháng 6, phần cứng này đã chính thức ra mắt tại thị trường trong nước. Tại sự kiện ra mắt, người sáng lập Mobvoi, Lý Chí Phong, nhấn mạnh rằng đây không chỉ là một máy ghi âm, một thiết bị dịch thuật hay một trợ lý giọng nói, mà là một "đối tác tư duy AI cá nhân."
Trước khi hỏi về lối thoát, một số công ty cả trong nước và quốc tế đã cố gắng kết hợp các mô hình lớn với phần cứng ghi âm, nhưng hầu hết vẫn coi AI là một công cụ để xử lý thông tin âm thanh, chủ yếu sử dụng nó để tổ chức ghi chú cuộc họp hoặc cho mục đích dịch thuật. Mặc dù TicNote có khả năng tương tự, nhưng định vị của nó vượt ra ngoài điều đó. Bằng cách liên tục ghi lại thông tin về công việc và cuộc sống của người dùng, TicNote hiệu quả trở thành một "trợ lý siêu cấp" đi kèm với người dùng 24/7, chủ động cung cấp cảm hứng làm việc và những hiểu biết dựa trên nội dung giao tiếp hàng ngày và khả năng suy luận của các mô hình lớn.
Là một "người bạn cũ" của Geek Park, chúng tôi đã chứng kiến toàn bộ hành trình của Out of the Door từ khởi nghiệp đến niêm yết, và trải nghiệm giai đoạn thu hẹp chiến lược theo hướng các mô hình lớn. Giờ đây, Out of the Door đã chọn cách gia nhập lại đường đua mô hình lớn theo cách phần cứng. Quyết định này không đơn thuần là theo xu hướng hay bắt chước, mà là kết quả của nhiều năm tích lũy của người sáng lập Li Zhifei trong lĩnh vực tương tác giọng nói giữa người và máy. Trong khi thấy các con đường hiện có được xác nhận, ông cũng nhận thức được những khả năng sâu sắc hơn và hy vọng tạo ra những sản phẩm tốt hơn theo hướng này.
Hình dáng của TicNote giống như một viên sạc từ tính nhỏ, với độ dày khoảng 3 milimét, cho phép nó được gắn vào mặt sau của điện thoại một cách từ tính suốt cả ngày, gần như không gây ảnh hưởng đến việc sử dụng hàng ngày.
TicNote | Từ: Mobvoi
Khác với các máy ghi âm truyền thống, thiết kế dạng thẻ của TicNote hướng đến các tình huống "ghi âm mọi thời tiết" ngay từ đầu. Người dùng có thể dễ dàng điều khiển chế độ hoạt động ghi âm.
Hình thức phần cứng này không phải là sự sáng tạo của Out of the Box; những sản phẩm trước đây như Plaud Note cũng đã áp dụng một thiết kế tương tự. Ưu điểm của nó nằm ở khả năng hoạt động ổn định trong thời gian dài trong các tình huống yêu cầu ghi âm giọng nói lớn, chẳng hạn như giáo dục, truyền thông và lập kế hoạch sáng tạo, đồng thời tận dụng khả năng của các mô hình lớn để nâng cao hiệu quả của việc chuyển đổi, dịch và tóm tắt trong quá trình xử lý sau.
Kịch bản ứng dụng này đã đạt được một mức độ xác thực thị trường nhất định, nhưng Mobvoi tin rằng sự kết hợp giữa phần cứng ghi hình kiểu thẻ và các mô hình lớn chứa đựng tiềm năng lớn hơn chỉ là chức năng ghi âm và xử lý.
Ngoài các chức năng cơ bản như chuyển văn bản và tóm tắt, tính năng lớn nhất của TicNote là AI Agent tích hợp sẵn "Shadow AI". Nó hỗ trợ các cuộc trò chuyện thời gian thực, lập luận logic, tích hợp kiến thức và gợi ý viết, cho phép hiểu sâu hơn về nhu cầu sáng tạo nội dung của người dùng. Dù là trong công việc, học tập hay trong quá trình khám phá cảm hứng, nó có thể duy trì một cuộc đối thoại với người dùng, hỗ trợ hoàn thành nhiệm vụ và trở thành một trợ lý thông minh cá nhân.
Yolanda là một trong những người dùng beta của TicNote. Là một giám đốc công nghệ và là mẹ của một đứa trẻ đang chuẩn bị cho kỳ thi vào trung học, cô ấy thường phải đối mặt với những thách thức của thời gian bị phân mảnh và quá tải thông tin, khiến việc cân bằng giữa gia đình và công việc trở nên khó khăn. TicNote đã giúp cô giải quyết vấn đề này rất nhiều.
Một cuộc họp phụ huynh trực tuyến trùng với một cuộc họp đánh giá quan trọng của công ty, vì vậy Yolanda không thể quản lý cả hai cùng một lúc. Do đó, cô đã sử dụng TicNote để "vô hình" ghi lại toàn bộ nội dung cuộc họp phụ huynh, chính xác chuyển ngữ và tự động trích xuất các điểm chính sau đó, tổ chức chúng thành biên bản rõ ràng và một bản đồ tư duy, cho phép cô nắm bắt thông tin cuộc họp một cách toàn diện mà không cần phải phát lại.
Ngoài ra, Yolanda cũng đã yêu cầu các em mang TicNote đến mỗi buổi học bổ trợ. Đến cuối học kỳ, TicNote không chỉ ghi lại các điểm chính từ giáo viên mà còn giúp tóm tắt những điểm yếu của các em. Khi kỳ thi vào trung học phổ thông đến gần, các em đã sử dụng TicNote để tổ chức "bộ công cụ tại chỗ" và "phương pháp khẩn cấp" được giáo viên dạy, và kết hợp với những điểm yếu của mình để tạo thành tài liệu ôn tập rõ ràng.
Từ kinh nghiệm của Yolanda, có thể thấy rằng TicNote không chỉ là một công cụ ghi âm di động, mà thông qua thiết kế tích hợp giữa phần cứng và phần mềm kết hợp với khả năng của mô hình lớn, nó đang dần phát triển thành một trợ lý thông minh thực sự "hiểu bạn". Đằng sau một sản phẩm như vậy là sự cống hiến suốt một thập kỷ của Mobvoi trong lĩnh vực công nghệ giọng nói và tương tác giữa người với máy.
Sự ra mắt của TicNote bởi Mobvoi không phải là ngẫu nhiên. Con đường "tích hợp phần cứng-phần mềm + dịch vụ AI" mà sản phẩm này đại diện thực sự là một kết quả tự nhiên của việc Mobvoi tích lũy công nghệ và khám phá sản phẩm suốt một thập kỷ qua.
Kể từ khi thành lập vào năm 2012, Out of the Door đã xác định tương tác giọng nói giữa con người và máy móc là hướng đi cốt lõi, trở thành một trong những công ty đầu tiên ở Trung Quốc thực hành khái niệm "giọng nói đầu tiên". Ứng dụng trợ lý giọng nói tự phát triển ra mắt trong những ngày đầu tập trung vào nhận diện giọng nói tiếng Trung và hiểu ngôn ngữ tự nhiên. Trong những năm tiếp theo, công ty liên tục cố gắng tích hợp khả năng giọng nói vào phần cứng, lần lượt ra mắt các sản phẩm như đồng hồ thông minh TicWatch, gương chiếu hậu thông minh TicMirror và máy dịch TicTranslator, không ngừng khám phá các khả năng ứng dụng của việc kết hợp giọng nói với thiết bị.
Những sản phẩm này đã đứng đầu ngành vào thời điểm đó và tích lũy được kinh nghiệm kỹ thuật đáng kể. Tuy nhiên, những thách thức như ngưỡng sử dụng và chi phí của tương tác bằng giọng nói luôn cản trở nó trở thành phương thức hoạt động chính. Người dùng cần giao tiếp với các thiết bị thông qua từ đánh thức và ngôn ngữ lệnh, điều này dẫn đến chi phí tương tác cao và độ dung sai lỗi thấp, khiến việc xử lý các nhiệm vụ phức tạp trở nên khó khăn. Do đó, Mobvoi tạm thời thu hẹp danh mục sản phẩm phần cứng của mình và chuyển trọng tâm sang việc cải thiện khả năng AI.
Nhưng sự tiến hóa của tương tác giữa con người và máy tính chưa bao giờ thực sự bị từ bỏ bởi Mobvoi. Sự xuất hiện của kỷ nguyên các mô hình lớn đã mang lại những cơ hội mới cho tương tác giọng nói giữa con người và máy tính. Với sự cải thiện trong khả năng hiểu và tạo ra mô hình, cuộc đối thoại giữa con người và máy tính đã trở nên tự nhiên hơn, và ngày càng nhiều người dùng bắt đầu giao tiếp với AI theo cách trò chuyện. Giọng nói, như là phương thức tương tác gần gũi nhất với thói quen biểu đạt của con người, đã lấy lại giá trị của nó và được kỳ vọng trở thành một Gateway quan trọng kết nối AI với thế giới thực.
TicNote được ra mắt trong bối cảnh này. Nó không chỉ là một thiết bị thông minh để ghi chép mà còn liên tục tổ chức nội dung mà người dùng nghe và nói mỗi ngày thành thông tin có cấu trúc thông qua AI Agent tích hợp "Shadow AI", tạo ra một "cơ sở tri thức" cá nhân hóa cho mỗi cá nhân. Dựa trên cơ sở tri thức cá nhân hóa này, mô hình lớn không chỉ có thể được truy cập một cách hiệu quả mà còn có thể kết nối với mạng để khám phá giá trị của thông tin ở các chiều cao hơn.
Biểu mẫu sản phẩm này là một hiện thân tích hợp của sự tích lũy công nghệ đa chiều trong nhận diện giọng nói, hiểu ngôn ngữ tự nhiên và thiết kế thiết bị đầu cuối của Mobvoi. Lấy tính năng “Flash Chat” của TicNote làm ví dụ, người dùng có thể khởi đầu các cuộc trò chuyện bằng giọng nói bất cứ lúc nào trong quá trình ghi âm, nhanh chóng xem lại nội dung trước đó và trích xuất thông tin quan trọng, phù hợp cho các tình huống cần phản hồi ngay lập tức, chẳng hạn như phỏng vấn và họp. Mô hình tương tác “ghi lại và hỏi” này là kết quả của mười năm nỗ lực liên tục của Mobvoi trong công nghệ giọng nói.
Đồng thời, TicNote cũng có khả năng quản lý dự án tự động. Trong quá khứ, ngay cả các máy ghi âm giọng nói AI cũng thường bị giới hạn trong một kịch bản duy nhất, chỉ xử lý một đoạn nội dung duy nhất sau khi ghi âm. Tuy nhiên, trong logic tương tác của TicNote, tất cả dữ liệu đã ghi được được thống nhất thành một cơ sở kiến thức có thể mở rộng bền vững, cho phép người dùng gọi, tổ chức và tiếp tục các cuộc trò chuyện qua các kịch bản và thời gian khác nhau bất cứ lúc nào. Cách tổ chức thông tin này trực quan hơn cho người dùng cũng có nghĩa rằng TicNote không còn chỉ dành cho những người dùng chuyên nghiệp, mà còn có tính ứng dụng rộng rãi trong việc sử dụng hàng ngày.
Quan trọng hơn, lần này, Out of the Door không còn cố gắng "kiểm soát một máy" bằng giọng nói, mà thay vào đó là tận dụng khả năng của các mô hình lớn để làm cho giọng nói trở thành một điểm khởi đầu cho việc xây dựng tri thức và hỗ trợ thúc đẩy tư duy.
Nhìn lại, TicNote không chỉ là một bước ngoặt trong hướng công nghệ, mà còn giống như một sự hoàn thiện—nó tập hợp mọi bước đi của Out There Asking trong suốt thập kỷ qua, tập trung những kinh nghiệm rải rác trên nhiều cấp độ như tương tác giữa người và máy, thiết kế phần cứng, và dịch vụ AI vào một sản phẩm phù hợp hơn với thời đại này.
Hiện nay, ADHD đã trở thành một chủ đề xã hội nóng hổi. "Khó khăn trong việc tập trung" như một triệu chứng đang trở nên ngày càng phổ biến. Ngoài những bệnh nhân ADHD thực sự, ngày càng nhiều người bình thường bắt đầu nhận thấy những triệu chứng tương tự ở bản thân và thậm chí bắt đầu "tự chẩn đoán."
Điều này có rất nhiều liên quan đến việc quá tải thông tin khổng lồ mà chúng ta đang trải qua. Nhìn lại, nhân loại chưa bao giờ phải nhận và xử lý nhiều thông tin mỗi ngày như chúng ta hiện nay. Thông tin đổ vào mắt chúng ta không chỉ qua điện thoại mà còn tồn tại trong mọi tình huống trong cuộc sống của chúng ta. Chúng ta nhận quá nhiều thông tin mỗi ngày, và thời gian tồn tại của suy nghĩ của chúng ta đang ngày càng ngắn lại.
Một nhận thức phổ biến trong quá khứ là, so với lao động thể chất, lao động trí óc thì dễ dàng hơn, và việc ngồi trong văn phòng là một "đặc quyền" dành cho một số ít người, một mối quan tâm chung của mọi người. Tuy nhiên, bây giờ, ngày càng nhiều người tham gia vào công việc liên quan đến thông tin, nhưng lại cảm thấy mệt mỏi hoặc thậm chí chán nản với nó.
Chúng ta ngày càng nhận thức được rằng việc xử lý thông tin cũng là một gánh nặng có thể dẫn đến "mệt mỏi." Hiện tại, chúng ta cần giảm bớt gánh nặng cho não bộ của mình, giống như chúng ta thay thế lao động thủ công bằng các công cụ cơ khí. Những thiết bị như vậy phải có khả năng nhận thức, tương tác và hỗ trợ tư duy cùng cái nhìn sâu sắc, trở thành "cảm giác chính" và "bộ não phụ" của chúng ta.
Có thể đây là tham vọng tối thượng của TicNote và Out of the Door to Ask.
Hôm nay, phần lớn các sản phẩm AI đang cung cấp cho người dùng thông tin từ "góc độ một kịch bản đơn lẻ." Thực tế, tương lai tối thượng của AI nên có khả năng hỗ trợ người dùng trong việc quản lý toàn bộ trí nhớ và suy nghĩ của họ, bao gồm không chỉ thông tin và kiến thức mà còn cả những kỷ niệm. Hiện tại, ngành công nghiệp AI đã đề xuất khái niệm "dòng đời." Dòng đời đã được ghi lại về cơ bản là "kho trí nhớ" của chúng ta. Điều mà AI Agentic có thể làm là nâng cao kho trí nhớ này, khai thác những suy nghĩ và hiểu biết mà chúng ta thường không nhận thức được, từ đó giúp chúng ta giảm bớt gánh nặng khi tiếp nhận thông tin và khơi dậy nhiều cảm hứng hơn.
Trong tương lai gần, mỗi chúng ta sẽ cần một trợ lý có trí nhớ hoàn hảo và khả năng hỗ trợ chúng ta trong suy nghĩ, giúp chúng ta tổ chức lại thông tin mà chúng ta nhận được và mở rộng các chiều kích của tư duy. Tính năng "Khoảnh Khắc Eureka" tích hợp trong TicNote đã cung cấp một cái nhìn thoáng qua về tương lai này. Nó có thể cung cấp cho người dùng những góc nhìn AI về "những hiểu biết" dựa trên dữ liệu được người dùng lưu trữ.
Hiện tại, phần lớn các sản phẩm trợ lý AI được đào tạo dựa trên các tập hợp công khai có sẵn theo một nghĩa rộng, và chúng chủ yếu nhắm đến mục tiêu "toàn tri và toàn năng" trong việc đào tạo và phát triển. Tuy nhiên, điều mà nhiều người dùng thực sự cần hơn là một loại "AI cá nhân hóa". AI có khả năng này nên hiểu biết về kiến thức riêng tư của chúng ta nhiều hơn và cung cấp thông tin phù hợp với chúng ta, giúp chúng ta xây dựng những trải nghiệm cá nhân hóa.
Đối với Du Chumen Wenwen và Li Zhifei, TicNote không chỉ là một sự hiện thực hóa thành công các lý tưởng công nghệ của họ trong suốt mười hai năm qua mà còn là một khởi đầu mới hướng tới tương lai của AIGC. Họ đã đến một kỷ nguyên mới của sự tương tác giữa con người và máy tính, một kỷ nguyên của AIGC. TicNote không phải là một "đầu cơ" về mặt sản phẩm, mà thực sự là một đỉnh cao của một "cuộc tình" công nghệ dài hạn.
Vào tháng 4 năm ngoái, Công nghệ Out of the Door đã lên sàn chứng khoán, trở thành cổ phiếu AIGC đầu tiên tại Trung Quốc. Đối với Lý Trí Phong và đội ngũ của mình, việc giải quyết vấn đề "tiền" chưa bao giờ là điều quan trọng nhất; điều quan trọng hơn là họ có thể tinh chỉnh công nghệ mà họ kiên định tin tưởng đến trạng thái tốt nhất và sau đó mang nó đến với thế giới.
Bây giờ, nó đã tiến thêm một bước vững chắc nữa.