Sự nổi lên của các trợ lý ảo và cái chết của hộp tìm kiếm

Sự nổi lên của các trợ lý ảo và cái chết của hộp tìm kiếm

rip-search-box-enge-800x459

Vào ngày mùng 1 tháng Ba, Behshad Behzadi, giám đốc của Google về tìm kiếm hội thoại, đã có một bài phát biểu tại SMX West ở San Jose. Bài phát biểu này tràn ngập những thông tin về quan điểm của Google về tìm kiếm đang ở đâu trong thời điểm hiện tại, và nó sẽ đi về đâu.

Trong bài báo này, tôi sẽ đánh giá về vài điều tôi rút ra từ bài phát biểu đó, sau đó đưa ra vài suy nghĩ của mình về những gì tương lai đang nắm giữ. Nói ngắn gọn lại, tôi sẽ phác thảo về việc tại sao điều này lại đe dọa số phận của “hộp tìm kiếm”.

Chúng ta thực sự có một cái nhìn sâu sắc về điều này ở ngay đầu của bài phát biểu. Mục tiêu của Google là giả lập máy tính “Star Trek”, thứ cho phép người dùng đàm thoại với máy tính trong khi cùng lúc truy cập vào tất cả các thông tin của thế giới. 

Behzadi cũng đưa ra một video từ bộ phim “Her” và lưu ý rằng “Star Trek” đã tưởng tượng về một tương lai của hơn 200 năm tới (chương trình này ban đầu được phát trong những năm 1960), và “Her” đã hình dung một tương lai của 20 năm sắp tới. Mặt khác Behzadi tin rằng điều này sẽ xảy ra trong dưới 20 năm.

Dòng thời gian của Google

Một đánh giá lịch sử ngắn gọn sẽ cho ta thấy Google đã thay đổi theo thời gian nhanh như thế nào:

2slides-page-002-800x450

Thêm vào đó, sự tăng trưởng của Google Knowledge Graphic là rất mau chóng:

2slides-page-003-800x450

Một động lực chính của thay đổi khác đó là chúng ta ngày càng có thêm những thiết bị để nói chuyện cùng tại nhà:

global-internet-devices-full

Kết quả là người dùng sẽ thấy thoải mái hơn khi nói chuyện với máy tính, và điều này sẽ thúc đẩy sự tăng trưởng của việc sử dụng ngôn ngữ tự nhiên trong các truy vấn tìm kiếm.

Một điều nữa thúc đẩy sự tăng trưởng của việc sử dụng ngôn ngữ tự nhiên đó là sự cải thiện trong chất lượng nhận diện giọng nói. Theo Behzadi, ngày nay tỷ lệ lỗi trong nhận diện giọng nói đã giảm xuống dưới tám phần trăm, trong khi hai năm trước nó là 25 phần trăm. Lưu ý rằng trong hơn 30 phút của bài phát biểu của mình, ông ấy liên tục thực hiện các trình diễn nhận dạng giọng nói, và không một lỗi nhận diện giọng nói nào xảy ra.

Vài điểm chính khác về sự tăng trưởng của tìm kiếm giọng nói:

1. Tìm kiếm giọng nói hiện tại đang tăng trưởng nhanh hơn tìm kiếm gõ phím.
2. Có rất nhiều trường hợp trong đó giọng nói là cách tốt nhất để tương tác (trong khi lái xe, nấu ăn).
3. Việc nói chuyện với điện thoại, khi đang ở trong một nhóm ngày càng được chấp nhận hơn.

Trong bài phát biểu trực tiếp mà tôi làm với Gary Illyes, ông ấy đã nói với tôi rằng số lượng các truy vấn giọng nói trong 2015 đã tăng gấp đôi so với 2014. Illyes cũng nói với tôi rằng các truy vấn giọng nói nhiều khả năng định hướng hành động hơn 30 lần so với truy vấn gõ phím.

Một dấu hiệu rõ rệt của xu hướng chuyển sang tìm kiếm giọng nói đó là nó mang tìm kiếm ra khỏi thực tế thông thường: vào một trang web và gõ truy vấn. Truy cập vào tìm kiếm giọng nói cần được phổ biến, không yêu cầu bạn phải đến một nơi đặc biệt để làm điều đó.

Tương lai của tìm kiếm là xây dựng người trợ lý hoàn hảo

Đó là những gì Behzadi nói với chúng ta, và ý tưởng về việc tìm kiếm nên là người trợ lý hoàn hảo là một khái niệm hấp dẫn về việc mọi thứ sẽ thế nào. Nó có rất, rất nhiều ý nghĩa.

Dưới đây Behzadi mô tả vài cách mà Google nghĩ về điều này trong thế giới coi di động là hàng đầu:

Đóng góp của thiết bị di động:

• Hiểu biết về thế giới
• Hiểu biết về bạn và thế giới của bạn
• Hiểu biết về hoàn cảnh hiện tại của bạn

Trợ lý của bạn cần phải ở nơi:

• Bất cứ nơi nào bạn cần
• Bất cứ nơi nào bạn đang có mặt
• Giúp bạn hoàn thành mọi việc

Trong trường hợp bạn băn khoăn về việc mọi người thích ứng tốt thế nào với việc sống thông qua trợ lý cá nhân của mình, bọn trẻ nhà tôi đã thích ứng tốt với điều đó, cũng như mẹ vợ 81 tuổi của tôi. Khi có nhiều cơ hội đến hơn, họ sẽ thích ứng tốt với nó.

Minh họa bằng các ví dụ

Behzadi tự tin rằng Google đang có những bước tiến lớn đến với các mục tiêu, và ông ấy cung cấp một loạt các trình diễn thú vị về sự tiến bộ mà Google đã đạt được.

Phân tích ngôn ngữ tự nhiên phức tạp

Ông ấy đã đưa ra nhiều ví dụ về điều này, nhưng một ví dụ nổi bật với tôi đó là truy vấn sau:

“Bạn có thể cho tôi biết trận đấu cuối của Arsenal như thế nào, tỷ số thế nào?”. Bạn có thể thấy kết quả ở dưới:

last-game-with-arsenal-338x600

Như bạn thấy, trong khi thực hiện truy vấn, khi tôi lặp lại trên điện thoại của mình, tôi đã thay đổi hướng của câu hỏi ở phần giữa. Google đã có thể phân tích nó và hiểu được câu hỏi thực sự bắt đầu ở nửa sau của câu hỏi bị thay đổi.

Kết hợp với ứng dụng

Một trình diễn thú vị khác đó là mức độ kết hợp với ứng dụng. Lúc Behzadi mở Viber, một ứng dụng nhắn tin và VoIP, và cho thấy một hội thoại của ông ấy với đồng nghiệp về bữa tối.

Một khách sạn mà họ nói tới là CasCal, là một quán bar ở Mountain View. Sau đó ông ấy nói “OK Google” và hỏi “Nó xa lắm không?” Google đã đưa ra câu hỏi.

Sau đó ông ấy nói “Call CasCal”.

IMG_2157-call-cascal-restaurant-after-opening-viber-chat-with-zineb-307x600

Vì chỉ là trình diễn, ông ấy sau đó đã tắt mắt, vì ông ấy thực sự không muốn nói chuyện với CasCal ở giữa bài phát biểu của mình, nhưng ông ấy tiếp tục điều này bằng truy vấn “đặt một bàn 8 giờ tối thứ Sáu cho năm người”, nó khởi động ứng dụng OpenTable.

IMG_2158-book-a-table-at-cascal-for-friday-377x600

Cuối cùng ông ấy hỏi ứng dụng Google “Điều hướng đến nhà hàng CasCal”, nó mở ứng dụng Google Maps.

IMG_2159-navigate-to-cascal-restuarant-322x600

Kiểu kết hợp ứng dụng này trải qua các tương tác rất phức tạp để giải quyết một nhu cầu khá cơ bản của con người. Hiện tại, Google chỉ tích hợp với khoảng 100 ứng dụng, nhưng con số đó đang tăng lên.

Google rõ ràng cũng đang tập trung vào các ứng dụng phổ biến nhất. Ví dụ như việc Behzadi tiến hành một trình diễn khác cho thấy sự tích hợp với Facebook và WhatsApp, điều đó khá tuyệt.

Hiểu được ngữ cảnh

Cũng có vài trình diễn thú vị khác liên quan đến việc hiểu được ngữ cảnh. Ở một trình diễn, ông ấy bắt đầu với truy vấn “rigi cao thế nào”. Tuy nhiên, vì ông ấy đang ở San Jose tại thời điểm đó, nó được hiểu là “Ricky cao thế nào” và có những thứ như là hình chụp màn hình được trả về:

how-high-is-rigi-first-try-1-338x600

Ông ấy thử lại lần nữa, và sau đó có kết quả cho truy vấn “reggie cao thế nào”, thứ mà ông ấy không muốn. Vì thế để giúp cho hệ thống, ông ấy sau đó thử truy vấn “các ngọn núi ở Thụy Sĩ”, nó hiển thị một kết quả như sau:

mountains-in-switzerland-338x600

Sau đó ông ấy thử truy vấn “rigi cao thế nào” và kết quả thật tuyệt:

how-high-is-rigi-338x600

Tôi đã hứa với bản thân là không viết quá nhiều ví dụ ở đây, nhưng tôi không thể cưỡng lại việc thêm vào ví dụ này. Nó bắt đầu với truy vấn “Các bức ảnh về Wales”. Tôi nói truy vấn này trong ứng dụng Google, nhưng tôi nhận được kết quả liên quan đến động vật (cá voi – whales) thay vì đất nước (xứ Wales), đây không phải là thứ tôi muốn.

pictures-of-wales-error-338x600

Vì thế tôi nhấn vào nút micro trong ứng dụng Google và đánh vần nó “w-a-l-e-s”. Và Google đã hiểu đúng:

w-a-l-e-s-338x600

Ghi nhớ ngữ cảnh trong suốt đoạn hội thoại

Tôi có một ví dụ cuối mà tôi muốn cho các bạn thấy trước khi tôi đi đến phần suy nghĩ của mình về ý nghĩa của tất cả các điều này. Đây là một ví dụ liên quan đến một tòa nhà nổi tiếng, và nó là một phiên bản chỉnh sửa từ trình diễn mà tôi đã làm nhiều lần. Ví dụ về các truy vấn như sau:

1. “Tháp coit ở đâu”
2. “Tôi muốn thấy các bức ảnh”
3. “Nó cao bao nhiêu”
4. “Ai xây dựng nó”
5. “Khi nào”
6. “Giờ mở cửa thế nào”
7. “Cho tôi thấy các nhà hàng quanh đó”
8. “Món Italy thế nào”
9. “Thực sự thì tôi thích món Pháp”
10. “Gọi nhà hàng thứ hai”

Thực sự khó tin, nhưng cuối cùng, Google đã kiểm soát được ngữ cảnh của cuộc hội thoại:

coit-10-call-the-2nd-one-338x600

Tất cả những điều này có ý nghĩa gì?

Google rõ ràng đã có những bước tiến lớn trong việc trở thành một trợ lý cá nhân hoàn thiện hơn và trong việc hiểu được ngôn ngữ tự nhiên. Họ cũng có một con đường dài để tiếp tục. Chúng ta hiện không có máy tính “Star Trek”, và nó rõ ràng sẽ mất hơn cả một thập kỷ tiếp theo. Behzadi tin rằng điều này sẽ ít hơn 20 năm, và có thể ông ấy đúng.

Như tôi khuyến nghị ở đầu đề bài báo, theo thời gian điều này sẽ kết thúc sự phụ thuộc của ta vào hộp tìm kiếm. Cuối cùng thì ý niệm về tìm kiếm thực sự là về việc có được truy cập vào thông tin. Trong dài hạn (hơn 10 năm kể từ giờ), chúng ta sẽ thấy đó là một tiện ích phải được tích hợp vào mọi thứ mà ta làm.

Thay vì việc tìm đến với hộp tìm kiếm, tất cả những gì mà tôi cần làm đó là đến với một thiết bị có truy cập đến trợ lý cá nhân của tôi. Đó có thể là đồng hồ thông minh, TV, điện thoại, máy tính bảng, xe của tôi hoặc các thiết bị khác giúp tôi quản lý thế giới quanh mình.

Bất cứ nơi đâu mà tôi đến, bất cứ điều gì tôi làm, tôi sẽ cần đến thông tin mà tôi muốn, thậm chí nếu nó không phù hợp với ngữ cảnh hiện tại. Lý tưởng là trợ lý cá nhân mà tôi sử dụng phải quan tâm đến ngữ cảnh hiện tại của tôi nhưng sẵn sàng để chuyển sang một ngữ cảnh khác nếu tôi hướng nó làm thế (tham khảo ví dụ “rigi” và “wales” mà tôi chia sẻ ở trên).

Chúng ta cũng sẽ quen với việc nghe mọi người nói chuyện với thiết bị của họ, và những kỳ thị mà ta thấy hiện nay sẽ biến mất. Bạn có thể đã thấy điều đó xảy ra, khi ngày càng nhiều người kỳ vọng về việc tương tác giọng nói với thiết bị của mình.

Tôi không thấy là bàn phím sẽ biến mất hoàn toàn. Ví dụ như tôi thường sẽ không yêu cầu trợ lý cá nhân mua thuốc trị trĩ bằng giọng nói khi đang ngồi trong văn phòng với những người khác.

Tôi nghĩ là ta sẽ tiếp tục có những tình huống mà truy vấn bàn phím sẽ là cách tốt hơn để làm việc trong thời gian tới. Nhưng tôi cũng nghĩ rằng lượng sử dụng bàn phím sẽ sụt giảm tại thời điểm nào đó trong tương lai (có thể là trong năm năm tới).

Tất nhiên một trong những vấn đề lớn đó là mọi người sẽ nói về điều này đó là sự thiếu riêng tư. Tôi đồng ý đó là một vấn đề quan trọng xứng đáng được chú ý.

Mặt khác đó là mọi người sẽ nhận được nhiều thứ từ việc có thể quản lý tốt hơn cuộc sống của mình bằng cách sử dụng công nghệ thông minh như trợ lý cá nhân. Tôi hy vọng đó là tất cả những gì nó chứa đựng, các vấn đề riêng tư, và sự đáng tin của những người nắm giữ thông tin về chúng ta, được xử lý tế nhị.

Google không là công ty duy nhất đầu tư vào công nghệ này. Apple với Siri và Microsoft với Cortana cũng đang đầu tư lớn vào công nghệ trợ lý cá nhân. Một điều chắc chắn đó là điều này sẽ đến với chúng ta rất nhanh!

Nguồn sưu tầm

By ANh ròm

Các tin khác