iPhone 5S sẽ có nút Home cảm ứng và nhận dạng vân tay
Có vẻ như iPhone 5S sẽ chỉ là phiên bản nâng cấp nhỏ của iPhone 5 cũng như không có nhiều thay đổi về mặt thiết kế. Thông tin mới nhất cho hay, thế hệ iPhone này sẽ sở hữu nút Home mới bằng cảm ứng được gắn đá sapphire chống xước hiệu quả. Được biết, chất liệu sapphire cũng đã được sử dụng để làm mặt kính cho camera của iPhone 5 đem lại nhiều hiệu quả.
Mặt khác, nút Home của iPhone 5S cũng sẽ tích hợp thêm cảm biến nhận dạng vân tay trong nỗ lực đưa những tính năng mới vào phiên bản iPhone này. Trước đó, cũng đã xuất hiện nhiều tin đồn cho rằng iPhone 5S được trang bị camera độ phân giải cao lên đến 13 megapixel iPhone 5S cùng tính năng dual-shot cho phép người dùng chụp hình và quay video bằng cả camera trước và sau cùng lúc.
Dự kiến, iPhone 5S sẽ hoạt động trên nền hệ điều hành iOS 7 có nhiều cải tiến về giao diện và sẽ được giới thiệu vào tháng 9 năm nay.
Theo GenK
Hệ thống phiên dịch giọng nói với độ chính xác cao đến từ Na Uy
Các nhà nghiên cứu tại đại học khoa học & công nghệ Na Uy (NTNU) đang tiến hành kết hợp 2 công nghệ nhận dạng giọng nói tự động nổi tiếng hiện nay để phát triển một thuật toán phiên dịch từ giọng nói sang văn bản không phụ thuộc ngôn ngữ hiệu quả hơn. Mục tiêu của thuật toán là giúp nhận dạng mọi ngôn ngữ được nói trong vòng chưa đầy 1 phút, phiên dịch các ngôn ngữ đang có nguy cơ biến mất và biến giấc mơ về những thiết bị điện tử điều khiển bằng giọng nói tiến gần đến hiện thực hơn.
Những cải tiến về sức mạnh xử lý giọng nói mà chúng ta đã thấy mang lại hy vọng về những hệ thống nhân dạng chính xác hơn và có độ phản hồi tốt hơn. Thế nhưng mọi chuyện lại không đơn giản và mặc dù công nghệ này vẫn đang tìm đường xuất hiện trên những điện thoại, máy tính bảng và máy tính cá nhân thì thời điểm nó trở thành một yếu tố thiết yếu trong các hệ thống có lẽ chỉ khi bàn phím hay các thiết bị nhập liệu khác biến mất.
Không dễ gì để đạt được độ chính xác cao song song với khả năng nhận diện thời gian thực. Ngay cả khi âm thanh được ghi nhận bởi một thiết bị có thể khử tạp âm hoàn toàn thì vẫn rất khó để ráp nối giữa sóng âm nhận biết bởi mic và âm vị đang được nói. Những người khác nhau nói cùng một ngôn ngữ luôn có sự khác biệt về sắc thái, trọng âm, nói ngọng và nhiều sai sót về phụ âm khác. Các yếu tố như tuổi tác, giới tính, sức khỏe và học vấn cũng đóng một vai trò quan trọng làm thay đổi âm thanh mà mic ghi được.
Nói cách khác, nếu chỉ tập trung cải tiến bộ xử lý thì nó vẫn vô dụng bởi chúng ta cũng cần một loạt các hành động thiết thực hơn để sử dụng tất cả sức mạnh theo đúng hướng và sự hiệu quả, độ tin cậy của các thuật toán máy tính có thể miêu tả sự đa dạng đáng ngạc nhiên của âm thanh khi nó phát ra từ miệng chúng ta và phiên dịch một cách chính xác những gì chúng ta đang nói.
Các nhà nghiên cứu tại NTNU hiện đang tiến gần đến một phát kiến mà nếu được khai thác hoàn toàn, nó có thể tạo nên một sự chuyển mình về hiệu năng của các ứng dụng phiên dịch giọng nói sang văn bản. Họ đã chứng minh rằng cơ chế của giọng nói con người về cơ bản giống nhau xuyên suốt mọi người nói và mọi ngôn ngữ, và nhóm nghiên cứu hiện đang "huấn luyện" cho một chiếc máy tính để phân tích áp lực của sóng âm được ghi lại bởi mic nhằm xác định những phần nào của giọng nói được sử dụng để tạo ra một âm vị.
Hầu hết các phần mềm nhận dạng giọng nói tốt nhất hiện nay đều yêu cầu người dùng cung cấp thông tin cá nhân của mình, bao gồm độ tuổi và trọng âm trước khi chúng cố gắng phiên dịch giọng nói trong lần đầu khởi động. Khi tạo xong một hình mẫu mới (profile), người dùng còn phải nói thử vài đoạn văn bản để cân chỉnh các thông số phần mềm.
Sở dĩ phải thực hiện thao tác này bởi phần mềm nhận dạng giọng nói thường sử dụng dữ liệu nạp bởi nhiều người dùng để liên tục cải thiện độ chính xác. Nó cũng sử dụng các công cụ xác suất - còn gọi là suy luận hay xác suất Bayes - để ước lượng xác suất của một âm thanh cụ thể được nói qua đó tạo nên những hình mẫu giọng nói của người dùng và nó sẽ không ngừng học hỏi và ghi nhớ qua thời gian. Điều này có nghĩa chất lượng của bản dịch có thể được cải tiến sau khi phần mềm thu thập một lượng lớn dữ liệu từ người dùng. Ngược lại, hệ thống nhận dạng giọng nói có thể sẽ không thật sự chính xác ngay sau khi người dùng tạo một hình mẫu mới.
Một phương pháp thay thế cho mô hình xác suất nói trên là nghiên cứu về giọng nói con người, các từ và cấu trúc câu cho một ngôn ngữ nào đó và suy ra các quy tắc để nạp vào phần mềm. Một ví dụ, những âm vị khác nhau cho thấy các tầng số cộng hưởng khác nhau và những dải đặc trưng cho các tần số này có thể được lập trình vào phần mềm để giúp nó nhận biết âm thanh chính xác hơn.
Hệ thống do NTNU phát triển là một sự pha trộn giữa 2 phương pháp trên: nó thu thập dữ liệu để học hỏi về sắc thái giọng nói của người dùng và cải thiện độ chính xác qua thời gian nhưng quan trọng hơn, nó cũng tích hợp các quy tắc rút ra từ việc nghiên cứu ngữ âm học.
Việc nhân biết áp lực của sóng âm trên mic có thể mang lại độ chính xác cao hơn so với các hệ thống trước đây. Chẳng hạn như âm thanh có thể được phân loại là âm kêu (dây thanh âm trong thanh quản sẽ rung) và âm không kêu (dây thanh âm không rung). Qua phân tích áp lực của sóng âm trong mic, hệ thống có thể phát hiện sự rung động của dây thanh âm một cách trực tiếp thay vì phải suy ra từ các tần số cao do mic thu được.
Do cơ chế giọng nói đều tương tự nhau đối với mọi người nên một trong những thế mạnh của hệ thống là nó hoàn toàn không phụ thuộc vào ngôn ngữ. Do đó, không giống như các hệ thống trước, nó có thể dễ dàng được thích nghi đối với một ngôn ngữ mới mà không cần phải hoạt động nhiều. Qua đó, mở ra khả năng nhận dạng các đặc ngữ do những nhóm người thiểu số sử dụng mà một phần mềm phiên dịch giọng nói sang văn bản thương mại không thể làm được.
Nhóm nghiên cứu hiện tại đang tìm cách phát triển một mô-đun nhận dạng giọng nói không phụ thuộc ngôn ngữ để thiết kế những sản phẩm phần mềm nhận dạng giọng nói mang tính cạnh tranh. Những phần mềm như vậy sẽ rất phù hợp cho việc phiên dịch văn bản thành nhiều ngôn ngữ bởi theo các nhà nghiên cứu cho biết, hệ thống chỉ mất từ 30 đế 60 giây để nhận biết ngôn ngữ được nói.
Theo TTVN
BlackBerry 10 cũng hỗ trợ nhận dạng giọng nói Sản phẩm có công nghệ như Siri của iOS hay Google Now của Android 4.1, ra mắt vào đầu năm 2013. RIM vừa công bố một bản cập nhật mới cho thiết bị thử nghiệm chạy BlackBerry 10 là chiếc điện thoại Dev Alpha. Sau khi khám phá các tính năng mới của thiết bị này, người ta phát hiện ra rằng, Dev...