Google оновив Dataset Search для більш ефективного пошуку даних



Сервіс пошуку даних Google, відомий як Dataset Search, перестав бути бета-версією. Google розширив можливості фільтрації пошуку і відкрив доступ до майже 25 мільйонам баз даних. Компанія не ділиться повною статистикою, проте заявила, що «сотні тисяч» користувачів спробували Dataset Search з моменту запуску пробної версії у вересні 2018 року. В цілому, сервіс отримав позитивні відгуки, стверджує Google.

Як пише theverge.com, створення Dataset Search - це спроба Google зібрати в єдине ціле «фрагментарний світ онлайн-даних у відкритому доступі». Хоча багато університетів, лабораторій і урядових інститутів публікують дані онлайн, знайти їх традиційним пошуком буває важко. Однак, додавши теги метаданих у відкритому доступі на свої веб-сайти, ці інститути можуть індексувати опубліковані дані в Dataset Search, який вже сьогодні надає доступ до 25 мільйонам баз даних, будь то статистика нещасних випадків під час катання на лижах, виверження вулканів або популяція пінгвінів.

Наташа Ной (Natasha Noy), дослідник в Google AI, яка брала участь у створенні Dataset Search, зазначила, що «більшість репозитаріїв даних були дуже дружні до пошуку». На її думку, запуск сервісу Dataset Search привів до того, що «наукові інститути тепер ставляться до публікації метаданих більш відповідально».

«Наприклад, журнал Nature змінює свої правила, вимагаючи поширення даних з належними метаданими», - говорить Ной. На її думку, такі зміни зроблять дані, що лежать в основі передових наукових досліджень, більш доступними в майбутньому.

Як підкреслює theverge.com, серед іншого, в Dataset Search була додана можливість фільтрації даних за типом (таблиці, картинки, текст, і т.д.), за ліцензією і географічною територією, де ці дані були зібрані. Крім того, Dataset Search тепер можна використовувати на мобільних телефонах.

У той же час, компанія Google відзначила, що 25 мільйонів баз даних - це тільки «частина баз даних, доступних онлайн», хоча і «значна частина». Найбільше в Dataset Search баз даних з геонаук, біології та сільського господарства, а найчастіші пошукові запити включають «освіту», «погоду», «рак», «злочинність», «футбол» і «собаки». США є лідером за кількістю відкритих урядових баз даних - онлайн їх опубліковано понад 2 мільйони.

Команда Dataset Search має намір розширювати кількість баз даних в пошуковику.

Джерело: https://noosphere.ru/news/google-obnovil-dataset-search-dlya-bolee-effektivnogo-poiska-dannyh-5e2d81f103b1e000011d0653

Коментарі

Приєднуйтесь до нас в соціальних мережах

Icon Icon

Книжкова полиця видань НБ ЗНТУ

Популярні публікації

Загальна кількість переглядів сторінки