奥飞寺圆栗
量子比特生产 |公众号
数据集搜索工具已上线。
在发布这条消息的博客中,团队大致表达了意思:
现在,许多领域的科学家每天呼吸的不是空气,而是数据集。没有数据集,它们就无法生存。
△ 只有数据集才能挽救生命
但是,由于数据集分散在世界各地,口口相传是最常见的传播途径。
希望让搜索数据集变得像搜索论文一样简单。
这样,就有了。
猫喜欢什么口味的冰淇淋?
这样,无论数据集在哪里发布,谷歌都会马上出来。
甚至有很多方法可以使用它,而且你少了一个不能很好地训练你的网络的理由。
那么,让我们一起试试吧。以下是衣食住行四大类,分别搜索。
·衣服·
穿着部分,搜索的是肥裤子:
然后,有关于墨西哥、秘鲁、哥伦比亚等各个国家的裤子的数据集。
例如,从棉裤的角度谷歌搜索引擎,可以看到墨西哥的经济状况。
·食物·
吃什么,我搜了冰淇淋:
最吸引人的当然不是每个国家的冰淇淋生产力。
猫喜欢什么年龄的,喜欢什么口味的冰淇淋,确实有(mei)一些(sha)的研究价值。
·直播·
只看北京房价,搜索房价:
第一个结果来自链家2011-2017年的数据。
这个数据集的杀伤力应该还是不错的。有兴趣的可以自行观察。
传送门://
·OK·
我觉得出行服务和共享单车不会有什么惊喜。刚刚搜索了一匹马:
当然,查出香港赛马的数据并不意外。
第二项是疝气数据,重点关注马的健康状况。有一项研究使用疝气来预测马的死亡概率。
数据集中还有上千个世界,你不妨自己搜索一下。
数据集搜索,不是一天建成的
为设置此搜索工具, 团队为提供数据集的人员准备了一份贴心指南。
这样,每个人都可以对贡献的数据集有一个统一的描述:
· 谁创建了数据集?
· 什么时候出版的?
· 数据是如何收集的?
· 怎么用?
……
一一填写信息,让搜索工具更友好。
描述的时候,只要按照标准的词汇,就可以。
一旦 收集到信息,它就会分析数据集的不同版本可能在哪里。
除此之外,请查看任何提及此数据集的论文(或其他出版物)。
团队表示此版本已经支持多种语言。对更多语言的支持也在路上。
例如,如果你想打败自己,现在可以直接搜索“中国房价”。
普通的谷歌搜索也可以搜索数据表
在数据集方面做了很多工作,而不仅仅是这个工具。
此外,该团队还添加了搜索表格数据以查找人类最常用的 搜索的功能。
△进化前VS进化后(右)
就这样,( ) 2014 年总支出已经可以搜索到了。
但是谷歌搜索引擎, 表示这些努力的结果还不够好。
他们希望在未来,无论是科研、政府部门、新闻机构,还是任何行业,都能从谷歌的平台上源源不断地搜索到数据。
意思是,能提供数据集的人,来碗吧。
传送门:
/
——结束——