Nhiều người cho rằng Trung Quốc dẫn đầu về AI? Báo cáo này nói “chưa chắc”
Một báo cáo mới cho thấy, bên cạnh quy mô dữ liệu, còn có nhiều yếu tố khác cần phải được xem xét trong quá trình phát triển AI, như chất lượng hay mức độ đa dạng của dữ liệu.
Trong buổi bình minh của kỷ nguyên trí tuệ nhân tạo, dữ liệu đang được xem như loại dầu thô mới còn Trung Quốc chính là tổ chức OPEC mới.
Nhưng một báo cáo mới được phát hành vào giữa tháng Bảy cho thấy, lượng dữ liệu khổng lồ do 1,4 tỷ dân Trung Quốc tạo ra có thể không phải là lợi thế lớn trong cuộc đua AI tòa cầu như người ta tưởng.
Được công bố bởi MarcoPolo, một tổ chức nghiên cứu tại Học viện Paulson ở Chicago, báo cáo này cho rằng, dữ liệu không phải là tài nguyên quan trọng duy nhất cho AI và cho dù lượng dự trữ dữ liệu khổng lồ của Trung Quốc, nước Mỹ vẫn đang nắm giữ các ưu thế quan trọng về chất lượng và mức độ đa dạng của dữ liệu.
“ Nhiều người cho rằng quy mô dân số Trung Quốc sẽ cho họ lợi thế về khối lượng dữ liệu, nhưng đây thực ra là một điều hiểu lầm.” Matt Sheehan, một thành viên của MarcoPolo cho biết trong báo cáo.
“ Mối quan hệ giữa dữ liệu và năng lực AI tương tự như mối quan hệ giữa lao động và nền kinh tế. Trung Quốc có thể có thừa lao động, nhưng chất lượng, cấu trúc và độ lưu động của lực lượng lao động cũng quan trọng với việc phát triển kinh tế.”
Nghiên cứu này được đưa ra vào thời điểm khi Trung Quốc và Mỹ, vốn đang cạnh tranh trên nhiều lĩnh vực về kinh tế và văn hóa, cùng đang chạy đua trong công nghệ AI.
Năm 2017, Hội đồng Nhà nước Trung Quốc phát hành bản kế hoạch 3 bước để đưa quốc gia này trở thành người dẫn đầu toàn thế giới về AI vào năm 2030. Trong tháng Hai năm nay, tổng thống Mỹ Donald Trump cũng ban hành một mệnh lệnh hành pháp với yêu cầu duy trì ngôi vị dẫn đầu về AI toàn cầu của nước Mỹ, chỉ thị các cơ quan chính phủ ưu tiên trí tuệ trong chi tiêu cho nghiên cứu và phát triển.
Quy mô dữ liệu chưa phải là tất cả
Video đang HOT
Trên quy mô lớn, cuộc đua về AI là cuộc đua về dữ liệu. Từ nhận diện gương mặt cho đến xe tự lái hoặc các máy dịch, hầu hết các ứng dụng AI chỉ có thể triển khai được sau khi các cỗ máy tiếp nhận một lượng dữ liệu khổng lồ để từ đó có thể tìm ra mối liên hệ giữa các mô hình dữ liệu đầu vào và kết quả đầu ra. Chỉ khi đó một cỗ máy mới có thể học cách thực hiện được các kỹ năng của con người.
Vì vậy, dữ liệu được nhiều nhà nghiên cứu công nghệ xem như một yếu tố quan trọng, nếu không muốn nói là nguồn lực chiến lược cho nền kinh tế AI.
Nhưng trong tài liệu của MarcoPolo, Sheehan đã tách dữ liệu ra thành 5 khía cạnh khác nhau: số lượng, chiều sâu, chất lượng, mức độ đa dạng và khả năng truy cập. Bằng cách phân tích mô hình khía cạnh này, thay vì chỉ dựa vào các nghiên cứu định lượng chung, báo cáo chỉ ra những ưu thế giữa Mỹ và Trung Quốc trong chất lượng dữ liệu của họ. Trung Quốc có các lợi thế về chiều sâu và khả năng tiếp cận vào dữ liệu, ngược lại, Mỹ lại có ưu thế vượt trội về chất lượng và sự đa dạng dữ liệu.
Hơn 800 triệu người dùng internet tại Trung Quốc đang tạo ra một lượng dữ liệu thừa thãi về các loạt hoạt động trực tuyến khác nhau, từ mua sắm hàng tạp hóa cho đến các sản phẩm có giá trị cao cũng như cả việc đặt bàn tại nhà hàng.
Nhưng hầu hết các nhà cung cấp dịch vụ internet tại Trung Quốc vẫn tập trung phần lớn vào thị trường trong nước của mình trong khi các công ty tại Thung lũng Silicon chủ yếu vươn mình ra toàn cầu. Người dùng của Google và Facebook đại diện cho những tập người dùng đa dạng về ngôn ngữ, cá tính dân tộc, văn hóa và quốc tịch hơn nhiều so với WeChat, ứng dụng nhắn tin hàng đầu Trung Quốc hiện nay.
Điều này sẽ tạo nên các khác biệt quan trọng về chất lượng ứng dụng AI. Ví dụ, chương trình nhận diện gương mặt có thể sẽ gặp khó khăn khi xác định những người không phải Trung Quốc – nếu tất cả dữ liệu họ dùng để nghiên cứu chỉ dành riêng cho các gương mặt của Trung Quốc.
Bà Samm Sacks phát biểu tại phiên điều trần trước Quốc hội Mỹ năm 2018.
MarcoPolo không phải là tổ chức duy nhất đánh giá lại về cái gọi là ưu thế dữ liệu của Trung Quốc. Samm Sacks, nhà nghiên cứu chính sách an ninh mạng và kinh tế số của Trung Quốc tại tổ chức New American, cho biết: “ Tiếp cận được nhiều dữ liệu nhất và bản thân nó không phải là yếu tố quan trọng nhất của việc phát triển AI.”
“ Điều hoang đường này đang tiếp sức cho việc hiểu nhầm về cái gọi là ưu thế dữ liệu của Trung Quốc, trong khi lại củng cố các lập luận chống lại quy định về tính riêng tư của Mỹ. Các chuyên gia công nghệ đang xem xét đến ảnh hưởng của những yếu tố khác như, sức mạnh điện toán, tài năng, các phép toán liên quan và loại dữ liệu có thể có giá trị.”
Theo GenK
Google nắm giữ lượng dữ liệu gấp 10 lần con số Facebook đang có về bạn, và đây là cách xem chúng
Cần nói thẳng ra rằng Google, Amazon, Apple và Microsoft đều đang theo dõi người dùng, và dữ liệu của chúng ta chính là miếng mồi ngon cho các công ty này.
Khi mà mọi cặp mắt đều đổ dần vào những vụ lùm xùm rò rỉ dữ liệu và xâm phạm quyền riêng tư của Facebook trong nhiều tuần vừa qua, chúng ta hầu như quên mất rằng còn có đến 4 công ty công nghệ lớn khác đang ngày đêm thu thập thông tin cá nhân của người dùng. Google, Amazon, Apple, và Microsoft, tất cả đều là những cái tên không thể không nhắc đến khi nói về "chủ nghĩa tư bản giám sát" và là những con diều hâu luôn chực chờ để xâu xé dữ liệu của chúng ta. Một thông tin gây sốc cho bạn đây: nếu bạn cho rằng Facebook nắm giữ quá nhiều dữ liệu về bản thân mình, thì những báo cáo mới nhất cho thấy Google nắm giữ lượng dữ liệu về bạn nhiều gấp 10 lần con số đó!
Vì tò mò muốn biết Google sở hữu bao nhiêu dữ liệu về mình, nhà phát triển web Dylan Curran cho biết anh đã tải về tập tin dữ liệu kia, vốn được Google cung cấp thông qua mục "My Account" trên trang quản lý tài khoản người dùng. Mục này được tạo nên vào năm 2015, cùng với một công cụ là "My Activity". Tập tin này tương tự như tập tin mà Facebook sẽ cung cấp cho người dùng nếu được yêu cầu. Liệu những tập tin như vậy có có chứa đầy đủ những thông tin mà Google hay Facebook nắm giữ hay không, không ai biết. Nhưng Curran nói rằng tập tin chứa dữ liệu của anh nặng đến 5,5 GB, tức gấp gần 10 lần tập tin anh tải về từ Facebook. Số lượng và loại dữ liệu chứa trong tập tin cho thấy Google không chỉ thường xuyên theo dõi những hoạt động trên mạng của bạn mà còn theo dõi cả vị trí bạn đang đứng ngoài đời thực nữa.
Tập tin chứa dữ liệu Google của Curran có chứa một lượng cực lớn thông tin về hoạt động lướt web của anh, có thông tin được thu thập từ...cả thập kỷ trước. Nhưng quan trọng hơn là, Google còn theo dõi cả những lần anh đi lại ngoài đời thực thông qua chiếc smartphone hay tablet của anh - bao gồm những địa điểm ngẫu nhiên mà anh thường lui tới, nhiều quốc gia và thành phố nước ngoài anh từng đến du lịch, các quán bar và nhà hàng anh đi đến khi ở các quốc gia đó, quãng thời gian anh dành ra tại các địa điểm này, và thậm chí là con đường anh đi đến đó và quay về nhà.
Những điều này không phải quá mới mẻ. Chúng ta đều biết rằng Google âm thầm theo dõi bạn ở khắp mọi nơi bạn đến và tạo ra một tấm bản đồ đường đi nước bước của bạn thông qua tính năng Location History. Bạn có thể tắt nó bằng cách vào timeline và tùy chỉnh ở đó.
Một người dùng Google khác đã tải tập tin của anh ta về và phát hiện ra công ty đã và đang lưu trữ dữ liệu của mình ngay cả khi duyệt web ở chế độ ẩn danh (Incognito) - một chế độ được quảng cáo là không lưu lại lịch sử duyệt web!
Giống Facebook, Google thu thập thông tin của bạn để bán cho các đối tác quảng cáo bên thứ 3, bao gồm tên, địa chỉ email, số điện thoại, thẻ tín dụng, những cách thức bạn dùng các dịch vụ của Google, chế độ tương tác của bạn với bất kỳ website nào sử dụng công nghệ Google (như AdWords chẳng hạn), thiết bị của bạn, và các câu lệnh tìm kiếm bạn đã gõ vào. Và nếu bạn không vào tài khoản của mình để thay đổi các thiết lập, thì bất kỳ điều gì bạn làm trên mạng có liên quan đến một công cụ bất kỳ của Google cũng sẽ bị theo dõi.
Chính sách của Google có đoạn sau: "Nếu những người dùng khác đã có địa chỉ email của bạn, hoặc các thông tin khác dùng để xác định danh tính của bạn, chúng tôi có thể cho họ thấy thông tin công khai trên Google Profile của bạn, như tên và ảnh của bạn".
Nhưng nhiều dữ liệu vị trí lại xuất phát từ việc sử dụng các ứng dụng Google như Maps hoặc Now - những ứng dụng có tính năng chia sẻ vị trí của bạn. Nếu bạn muốn ngừng việc chia sẻ thông tin này, bạn phải vào phần thiết lập tài khoản và điều chỉnh ở đó.
Mục đích mà Google vẽ ra nhằm ngụy biện cho việc chia sẻ dữ liệu là nhằm cải tiến trải nghiệm người dùng, nhưng ai được hưởng lợi hơn lại là điều gây tranh cãi. Cũng trong năm hãng này công bố mục "My Activity" nói trên, một chương trình mới cũng được họ tiết lộ - trong chương trình này, email của bạn sẽ bị chia sẻ cho các đối tác quảng cáo lớn của Google. Được gọi là "Customer Match", hệ thống này chọn lọc và tối ưu thông tin người tiêu dùng để chèn quảng cáo vào đúng nơi, với nội dung phù hợp với khách hàng, ở những thời điểm mà Google cho rằng người dùng dễ tiếp nhận nhất.
Chính sách của Google còn liệt kê 3 hạng mục chính trong việc thu thập dữ liệu: Những thứ bạn làm; những thứ bạn tạo nên; và những thứ định nghĩa nên con người bạn.
Nhưng bạn vẫn có khả năng hạn chế sự lộ lọt các thông tin cá nhân này. Bạn có thể tắt theo dõi vị trí, tắt tìm kiếm giọng nói, và các tính năng khác; bạn có thể xem và điều chỉnh các thiết lập cá nhân; bạn có thể thay đổi hồ sơ công khai, và tải về tập tin dữ liệu Google để xem họ có gì về bạn.
Ngoài ra, bạn có thể cao tay hơn và xóa toàn bộ dữ liệu của bạn, không chỉ từ Google mà còn từ nhiều dịch vụ trực tuyến khác.
1. Đầu tiên, vào Deseat.me và đăng nhập bằng tài khoản Gmail
2. Nhìn xuống danh sách các tài khoản đã đồng bộ và chọn những tài khoản bạn muốn xóa, những tài khoản muốn giữ lại
3. Nhấn nút "Delete" là xong.
Liệu xóa dữ liệu từ các công ty đang thu thập thông tin về bạn có ngăn được vấn nạn khai thác dữ liệu hay không? Chắc chắn là không. Nhưng ít ra chúng ta có cơ hội để khiến mọi người chú ý hơn đến những hệ quả của một nền kỹ trị đang nhăm nhe tìm cách tư nhân hóa hoạt động giám sát/theo dõi người dùng.
Theo GenK
Báo cáo doanh thu Nokia trong Q2/2019 đạt 5,69 tỷ Euro nhờ vào công nghệ 5G Sau nhiều cố gắng, doanh số Nokia trong quý 2/2019 đã có chuyển biến tốt hơn. Theo số liệu thống kê, Nokia ghi nhận mức tăng doanh thu trong Q2/2019 vượt so với dự báo. Lý giải về mức tăng trưởng trên, mảng cơ sở hạ tầng mạng tại Phần Lan của Nokia đã thành công trong việc đáp ứng nhu cầu ngày...