Google trình làng công cụ tìm kiếm tập dữ liệu

Theo dõi VGT trên

Google đang áp dụng thử nghiệm công cụ tìm kiếm tập dữ liệu cho cộng đồng khoa học.

Công cụ tìm kiếm tập dữ liệu ( Dataset Search) mới ra mắt của Google được kỳ vọng sẽ trở thành bạn đồng hành hữu hiệu với Google Scholar – công cụ tìm kiếm nghiên cứu và báo cáo học thuật hiện tại. Các viện nghiên cứu của các trường Đại học hay các tổ chức chính phủ khi công bố dữ liệu online sẽ cần thêm các metadata tags (các tags siêu dữ liệu) ở trang web để cung cấp mô tả về dữ liệu, bao gồm các thông tin về tác giả, thời gian công bố, cách thức dữ liệu được thu thập… Những thông tin này sau đó sẽ được sắp xếp lại theo thứ tự thành mục lục trên Dataset Search.

Phát biểu trong bài phỏng vấn của The Verge, Natasha Noy – một nhà khoa học nghiên cứu tại Google AI, người đã góp phần tạo nên Dataset Search – chia sẻ về mục tiêu hợp nhất 10.000 kho dữ liệu online: “Chúng tôi muốn dữ liệu được chia sẻ nhưng không bị di chuyển mà ở nguyên tại nơi đang lưu giữ”.

Hiện tại, các tập dữ liệu công khai khá rời rạc. Mỗi lĩnh vực khoa học khác nhau lại có kho dữ liệu riêng. Điều này xảy ra tương tự với các kho dữ liệu của chính phủ hay chính quyền địa phương. Natasha Noy cho biết thêm: “Các nhà khoa học chia sẻ rằng họ biết chính xác nơi tìm kiếm dữ liệu cho lĩnh vực của họ nhưng không phải lúc nào cũng vậy. Khi bước ra khỏi lĩnh vực thế mạnh của mình, họ sẽ gặp khó khăn”.

Noy lấy ví dụ về cuộc trò chuyện mới đây với một nhà nghiên cứu khí hậu. Cô than phiền với Noy rằng mình đang tìm kiếm tập dữ liệu về nhiệt độ đại dương cho một nghiên cứu sắp tới nhưng không thể thấy. Mãi đến khi tình cờ gặp một người đồng nghiệp ở một buổi hội thảo, cô mới biết dữ liệu mình cần được lưu giữ ở đâu. Cũng chỉ đến lúc đó cô mới có thể tiếp tục nghiên cứu của mình.

“Thậm chí đó không phải là một kho dữ liệu quý hiếm đặc biệt” – Noy nhấn mạnh – “Tập dữ liệu được ghi chép và lưu giữ ở một nơi khá nổi tiếng nhưng vẫn rất khó để tìm thấy”.

Google trình làng công cụ tìm kiếm tập dữ liệu - Hình 1

Video đang HOT

Ví dụ cho kết quả tìm kiếm về báo cáo thời tiết bằng Google Dataset Search

Trong lần ra mắt đầu tiên, Dataset Search sẽ bao gồm các chủ đề khoa học môi trường, khoa học xã hôi, dữ liệu chính phủ và các tập dữ liệu từ những viện tin tức như ProPublica. Tuy nhiên, nếu ứng dụng này trở nên phổ biến, lượng dữ liệu thu thập được sẽ tăng lên nhanh chóng bởi các viện nghiên cứu và các nhà khoa học sẽ tranh nhau chia sẻ thông tin của họ.

Jeni Tennison – CEO của Viện nghiên cứu Dữ liệu mở (ODI) – cho hay: “Tìm kiếm tập dữ liệu luôn khó khăn nhưng tôi hy vọng sự tham gia của Google sẽ giúp điều này trở nên dễ dàng hơn”.

Theo Tennison, để tạo một công cụ tìm kiếm hiệu quả, cần phải nắm rõ hai điều. Thứ nhất là cần xây dựng một hệ thống thân thiện với người dùng. Thứ hai, cần tìm hiểu tâm lý hành vi hay ý định của người dùng khi họ gõ các cụm từ cụ thể để tìm kiếm. Google biết cách thực hiện cả hai điều trên.

Thật vậy, Tennison chia sẻ, lý tưởng nhất là Google sẽ công bố hướng dẫn cách vận hành của Dataset Search. Mặc dù các metadata tags sẽ công khai nguồn dữ liệu được công bố, các công cụ lấy dữ liệu tự động vẫn là một tiêu chuẩn mở, nghĩa là bất kỳ đối thủ nào, ví dụ như Bing hay Yandex, đều có thể phát triển một dịch vụ cạnh tranh. Công cụ tìm kiếm phát triển nhanh nhất chỉ khi một lượng người dùng đáng kể cùng chia sẻ dữ liệu của họ.

“Điều cơ bản và quan trọng nhất là phải hiểu cách mọi người tìm kiếm thông tin” – Tennison nói – “Nếu chúng ta muốn hiểu được cách mọi người tìm kiếm thông tin và khiến thông tin dễ dàng được tìm thấy, sẽ thật tuyệt nếu Google chia sẻ dữ liệu của chính họ về điều này”.

Theo vtv

Công cụ tìm kiếm của Google tại Trung Quốc lưu trữ cả số điện thoại người dùng

Thông tin đáng quan ngại tiếp theo về dự án Dragonfly của Google tiếp tục được The Intercept đăng tải. Một số nguồn tin cho hay, nguyên mẫu công cụ tìm kiếm mà Google xây dựng tại Trung Quốc sẽ lưu trữ cả số điện thoại của người dùng.

Công cụ tìm kiếm của Google tại Trung Quốc lưu trữ cả số điện thoại người dùng - Hình 1

Tang web 256.com ghi lại năm 2008, trang web được Google mua lại từ công ty Cai Wensheng.

Theo nguồn tin của The Intercept, Google đã hoàn thành nguyên mẫu của công cụ tìm kiếm mới cho phép chính phủ Trung Quốc kiểm duyệt. Công cụ này sẽ liên kết kết quả với số điện thoại của người dùng để giúp Bắc Kinh dễ dàng theo dõi và truy vấn bất kỳ trường hợp nào vi phạm chính sách của họ.

Công cụ tìm kiếm nói trên nằm trong dự án bí mật có tên Dragonfly cho các thiết bị sử dụng hệ điều hành Android. Hệ thống sẽ tự động xóa các nội dung mà các nhà hành pháp Trung Quốc cho là nhạy cảm, chẳng hạn thông tin chống lại chính phủ nước này, các thông tin về tự do ngôn luận, dân chủ, bình quyền và kêu gọi biểu tình.

Cùng với một số thông tin đã được tiết lộ trước đây về dự án Dragonfly, The Intercept cho rằng để xây dựng "Vạn lý trường thành" trên mạng Internet cho chính phủ Trung Quốc, Google đã biên soạn sẵn một bản danh sách đen các từ khóa bị kiểm duyệt bao gồm: "quyền con người", "sinh viên biểu tình" và "giải thưởng Nobel" bằng tiếng Trung phổ thông.

Các tổ chức hoạt động vì nhân quyền hàng đầu đã chỉ trích gay gắt dự án Dragonfly. Họ cho rằng việc tiếp tay cho Bắc Kinh là hành vi "đồng lõa, vi phạm nhân quyền". Mối quan tâm lớn nhất của các nhà hoạt động nhân quyền không chỉ là vấn đề kiểm duyệt, mà tất cả dữ liệu người dùng trên công cụ tìm kiếm này đều được Google lưu trữ trên cơ sở dự liệu tại Đại lục. Nhờ đó, chính phủ Trung Quốc có thể dễ dàng truy cập, mục tiêu bị nhắm tới thường xuyên là đối tượng hoạt động trong lĩnh vực chính trị và truyền thông.

Công cụ tìm kiếm của Google tại Trung Quốc lưu trữ cả số điện thoại người dùng - Hình 2

Ảnh minh họa: TheDailyDot

Chưa kể tới, nguyên mẫu hiện tại được xây dựng có thể liên kết công cụ tìm kiếm trên thiết bị Android với số điện thoại của người dùng. Nhà nghiên cứu Internet cấp cao Cynthia Wong của Tổ chức Theo dõi Nhân Quyền (Human Right Watchs) cho rằng: "Điều này làm nảy sinh vấn đề từ quan điểm về quyền riêng tư, bởi nó sẽ cho phép theo dõi chi tiết và xác định hành vi của mọi người". Bà Wong nói thêm: "Việc liên kết kết quả tìm kiếm với số điện thoại cụ thể khiến người dùng khó tránh khỏi phương thức giám sát thái quá của chính phủ Trung Quốc".


The Intercept cho biết nhân sự làm việc cho đối tác của Google tại Đại lục được cấp phép để cập nhật danh sách đen các từ khóa bị cấm. Ngoài ra, toàn bộ dữ liệu về thực trạng ô nhiễm không khí đã được thay thế bằng thông tin do một nguồn tin giấu tên của Bắc Kinh cung cấp.Theo bài báo đăng tải trên tạp chí Wall Street Journals, Alphabet (công ty mẹ của Google) sẽ vận hành công cụ tìm kiếm nói trên như một phần của quan hệ hợp tác "liên doanh" với công ty Cai Wensheng. Công ty sở hữu 265.com, trang web được Google mua lại hồi tháng 6/2008, trước khi chính thức tuyên bố rời thị trường tỷ dân vào năm 2010.

Cho tới nay, đã hơn 1 tháng kể từ chi tiết đầu tiên được tiết lộ, Google vẫn tìm cách né tránh các câu hỏi liên quan tới dự án Dragonfly từ các tổ chức nhân quyền, phóng viên và thượng nghị sĩ Mỹ. Đại diện Google nói: "Chúng tôi không bình luận về những suy đoán về các kế hoạch trong tương lai của công ty".

Ngày 13/2 vừa qua, 16 nhà chức trách Mỹ đã bày tỏ mối "quan ngại nghiêm trọng" thông qua bức thư gửi tới Giám đốc điều hành Sundar Pichai và yêu cầu Google công khai kế hoạch về dự án Dragonfly. Đồng thời, nhà nghiên cứu Jack Poulson cùng 4 nhân viên cao cấp của Google đã tuyên bố nghỉ việc.

Trả lời phỏng vấn của The Intercept, ông Poulson thẳng thắn đề cập tới việc công ty đặt lợi nhuận lên trên tôn chỉ hoạt động. Trong bức thư đệ trình lên ban lãnh đạo, ông viết: "Tôi coi yêu cầu khống chế kết quả tìm kiếm, đồng thời chấp nhận sự kiểm duyệt và giám sát để đánh đổi quyền hoạt động tại thị trường Trung Quốc mà ban lãnh đạo Google đã quyết là một sự suy giảm giá trị và vị thế đàm phán của Google với các chính phủ trên toàn cầu".

Theo The Intercept

Bạn thấy bài viết này có hữu ích không?
Có;
Không

Tin liên quan

Tin đang nóng

Khởi tố TikToker Nam 'Birthday'Khởi tố TikToker Nam 'Birthday'
07:33:41 24/01/2025
Hoa hậu Tiểu Vy bị co giật bất tỉnh, tình trạng hiện tại ra sao?Hoa hậu Tiểu Vy bị co giật bất tỉnh, tình trạng hiện tại ra sao?
11:13:12 24/01/2025
Dựng cây nêu đón Tết, nhiều người bị điện giật nằm la liệtDựng cây nêu đón Tết, nhiều người bị điện giật nằm la liệt
07:17:43 24/01/2025
Vừa nhận thưởng Tết, con dâu chưa kịp vui đã choáng với yêu cầu của mẹ chồngVừa nhận thưởng Tết, con dâu chưa kịp vui đã choáng với yêu cầu của mẹ chồng
08:52:34 24/01/2025
Không phải Trấn Thành - Hà Hồ, đây mới là người đứng sau tiết mục gây bão mạng của Minh HằngKhông phải Trấn Thành - Hà Hồ, đây mới là người đứng sau tiết mục gây bão mạng của Minh Hằng
06:52:25 24/01/2025
Thêm 1 cặp sao Việt bị đồn phim giả tình thật, công khai khóa môi trước hàng trăm người khiến ai cũng sốcThêm 1 cặp sao Việt bị đồn phim giả tình thật, công khai khóa môi trước hàng trăm người khiến ai cũng sốc
07:30:24 24/01/2025
'Hoàng tử' Barron Trump gây sốt trong lễ nhậm chức của cha'Hoàng tử' Barron Trump gây sốt trong lễ nhậm chức của cha
06:41:33 24/01/2025
Thảm đỏ hot nhất hôm nay: Trấn Thành gây sốt vì "cưa sừng làm nghé", 1 nàng hậu xinh như công chúa xé truyện bước raThảm đỏ hot nhất hôm nay: Trấn Thành gây sốt vì "cưa sừng làm nghé", 1 nàng hậu xinh như công chúa xé truyện bước ra
07:25:14 24/01/2025

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024
Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn
Cách đăng Facebook để có nhiều lượt thích và chia sẻ

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022
Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết
Thêm nhiều bang của Mỹ cấm TikTok

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022
Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung
Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022
Microsoft đã cập nhật thỏa thuận cấm khai thác tiền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác tiền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...
Facebook trấn áp hàng loạt công ty phần mềm gián điệp

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022
Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia
Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022
Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản tiền phạt lên tới ...
Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022
Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter
Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022
Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm
Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022
Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR
'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

09:37:54 21/12/2022
Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn
Xiaomi sa thải hàng nghìn nhân sự

Xiaomi sa thải hàng nghìn nhân sự

09:35:12 21/12/2022
Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn
Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

09:34:00 21/12/2022
Đối với Trung Quốc, việc mất vị trí độc quyền sản xuất MacBook tượng trưng cho vị thế công xưởng thế giới của Trung Quốc đang bị suy yếu

Có thể bạn quan tâm

Tử vi 12 con giáp hôm nay ngày 24/1/2025: Tỵ tiêu cực, Mùi thuận lợi

Tử vi 12 con giáp hôm nay ngày 24/1/2025: Tỵ tiêu cực, Mùi thuận lợi

Trắc nghiệm

12:24:31 24/01/2025
Tử vi 12 con giáp hôm nay ngày 24/1/2025, Tỵ hãy tự tin hành động, Mùi không nên chủ quan.Tử vi 12 con giáp hôm nay ngày 24/1/2025 cho thấy người tuổi Tý
Không khí xuân ngập tràn với những bộ cánh đa sắc màu

Không khí xuân ngập tràn với những bộ cánh đa sắc màu

Thời trang

12:09:04 24/01/2025
Nếu bạn đang theo đuổi phong cách an toàn với những gam màu trầm nhàm chán thì những thiết kế đa sắc màu dưới đây sẽ là gợi ý lý tưởng giúp bạn có sự bứt phá, linh hoạt và đầy phá cách cho năm mới.
Doãn Hải My - vợ Văn Hậu bất ngờ can thiệp thẩm mỹ, nhan sắc thay đổi thế nào ngày giáp Tết?

Doãn Hải My - vợ Văn Hậu bất ngờ can thiệp thẩm mỹ, nhan sắc thay đổi thế nào ngày giáp Tết?

Sao thể thao

11:53:40 24/01/2025
Tối 23/1, trên trang Instagram cá nhân, bà xã hậu vệ Đoàn Văn Hậu - nàng WAG Doãn Hải My gây choáng khi bất ngờ công khai chuyện can thiệp thẩm mỹ, làm đẹp để đón Tết.
Triệu tập tài xế taxi dùng gậy đập phá xe tải ở TP.HCM

Triệu tập tài xế taxi dùng gậy đập phá xe tải ở TP.HCM

Tin nổi bật

11:48:43 24/01/2025
Ngày 24.1, nguồn tin PV Thanh Niên cho biết, Công an xã Đông Thạnh (H.Hóc Môn, TP.HCM) đã triệu tập và đang lấy lời khai nam tài xế taxi có hành động dùng gậy chặn, đập phá gây hư hỏng xe tải.
NPH ban lệnh cấm 100 năm, game thủ hoan hỉ, mừng rỡ trước quyết định nghiêm khắc

NPH ban lệnh cấm 100 năm, game thủ hoan hỉ, mừng rỡ trước quyết định nghiêm khắc

Mọt game

11:13:39 24/01/2025
Tựa game đang được nhắc tới trong câu chuyện lần này là Marvel Rivals - một trong những bom tấn nổi bật nhất giai đoạn cuối năm 2024 vừa qua.
Từ trong tù, Diddy "phản công" cực căng trước thông tin lộ băng sex với loạt sao nổi tiếng

Từ trong tù, Diddy "phản công" cực căng trước thông tin lộ băng sex với loạt sao nổi tiếng

Sao âu mỹ

11:11:18 24/01/2025
Vào ngày 23/1, Page Six đưa tin Diddy đã đệ đơn kiện phỉ báng đối với luật sư Courtney Burgess, quản lý âm nhạc Ariel Mitchel và Nexstar Media Inc. - đơn vị điều hành NewsNation.
7 chiếc nồi mẹ tôi nhất quyết vứt đi: Loại khó nấu, loại sinh độc hại "mời gọi" ung thư

7 chiếc nồi mẹ tôi nhất quyết vứt đi: Loại khó nấu, loại sinh độc hại "mời gọi" ung thư

Sáng tạo

11:09:27 24/01/2025
Hôm trước mẹ ghé nhà tôi chơi, sau khi đi 1 vòng quanh bếp liền chỉ tay vào mấy cái nồi và phán ngay: Con hãy loại bỏ những thứ này! . Mẹ đã nấu ăn mấy chục năm và từng thử qua mọi loại nồi, cái nào dùng dở là biết ngay.
Bắp cải 'đại kỵ' với 4 nhóm người này

Bắp cải 'đại kỵ' với 4 nhóm người này

Sức khỏe

10:08:59 24/01/2025
Các anthocyanin có trong bắp cải không chỉ giúp chống viêm. Nghiên cứu cho thấy chúng làm tăng thêm lợi ích sức khỏe của bắp cải bằng cách giảm nguy cơ mắc bệnh tim.
Nhóm nữ từng nhận được sự yêu thích bùng nổ khắp thế giới, giờ trở thành "nạn nhân" hay ăn vạ gây phiền nhất Kpop

Nhóm nữ từng nhận được sự yêu thích bùng nổ khắp thế giới, giờ trở thành "nạn nhân" hay ăn vạ gây phiền nhất Kpop

Nhạc quốc tế

10:02:19 24/01/2025
Đang đứng hiên ngang trên đỉnh vinh quang, sư nghiệp của NewJeans bất ngờ lao đao xuống dốc khi trở thành tâm điểm vụ bê bối tranh chấp giữa tập đoàn HYBE và Min Hee Jin.
Sắc vóc trẻ trung, quyến rũ của Á hậu Thụy Vân

Sắc vóc trẻ trung, quyến rũ của Á hậu Thụy Vân

Người đẹp

10:00:06 24/01/2025
Ở độ tuổi U40, Á hậu Thụy Vân vẫn sở hữu sắc vóc ngày càng trẻ trung, xinh đẹp và quyến rũ. Á hậu Thụy Vân vẫn giữ được body gọn gàng, đường cong chuẩn mực và nhan sắc cực phẩm.
Thiều Bảo Trâm "khóa môi" với một chị đẹp, mong chồng tương lai không bao giờ nhìn thấy

Thiều Bảo Trâm "khóa môi" với một chị đẹp, mong chồng tương lai không bao giờ nhìn thấy

Sao việt

09:59:21 24/01/2025
Khoảnh khắc Thiều Bảo Trâm khóa môi một chị đẹp đã lập tức gây bão cõi mạng và khiến cho chính chủ cũng phải lên tiếng giải thích.