新知一下
海量新知
5 9 9 2 7 4 7

专利检索中的非专利文献

专利榜 | 专利运营,专利检索,专利布局 2020/06/17 22:36

“专利榜”

打造您身边的专利管家

(专利讯息,专利查询,专利转让)

版本声明

本文部分来源“网络”

由专利老白整理

保留作者及以上版权声明,无须授权即可转载

新知达人, 专利检索中的非专利文献

非专利文献

深人了解现有的发明可以为新发明的出现带来希望和灵感,为闻所未闻、见所未见的技术问题提供新的解决方法。作为申请人或发明人,检索多达700万件的美国专利已然任重道远,而本都分关注的非专利文献则使检索的难度雪上加霜。以下将介绍如何检索非专利文字资料(文章、技术出版物、广告、论文等)。

每个非专利文献供应商都收录了大量不同的信息,包括许多与特定主题相关的期刊、科学会议摘要、博土论文等。另外,Pm的现有技木数据摩是许多财高500强企业进行大量技术公开的所在地。 除了部分知名公司的置名出版物外,IBM、摩托罗拉和西门子等创新公司还会发布具有完格作者信息的技术资料。IP.com的现有技术数据库还是最新IBM技术发明通报(IBMTech nical Disclosure Bulletin,IBM_TDB)在线文档的独家发布场所。

因此,检索P.com对机械或电气工程领域的检索大有裨益。

检索技术出版物的困难之一在于相关资料并非总是公开可用的。如果需要调查大量全文资料,发行商的版权费有时会过于高昂。从长远来看,订阅 Proquest、 Reed Elsevier、 EBSCO等数据存储库,或者分别订阅相应的期刊具有较高的性价比。

Delphion等检索引擎同时涵盖了专利和非专利文献。但是,Delphion的信息直接提取自其他来源,也就是P.com和IBMTDB。实施检索后,除非检索人员同时拥有IP.com的账号,否则只能获得IP.com提供的文摘。幸运的是,来自 IBM TDB的非专利文献是全文可用的。不过据推测, Delphion中的非专利文献主要涉及电子和计算机等高科技领域。

互联网互联网的定义数以百万计,规模更是千变万化。不过,简而言之,其数量将远远超出我们的想象。尽管没有人知道全球网络的确切规模,但事实上只要有耐心和知识就可以进行管理和检索。如果它存在,那么在网络上的某个地方或许就有它的线索。互联网检索有利有弊。其优势包括查找信息的从容一一无需离开豪华的真皮计算机座椅即可掌控世界于股掌;

互联网一年365天,全天24小时开放一这意味着你可以在任何时间查找信息;它也不会限制可查找的数据量。其缺点在于,网络上的信息并非全部合法、真实。有些信息半真半假,有些则完全是假的日期难以确定。由于网页总是不断更新,一项创意也许已经存在数年,但只是因为缺少公开发布日期而无法成为现有技术。有信誉的来源也同样难求,而且据估计互联网上有4000个网页。

比如,全世界最著名的豆芽农场主的主页列出了抗虫豆芽品种以及通过实验杂交改良基因的方法。这些信息的确存在并向公众公开,但如果日期无法核实就会被忽略。虽然无法作为可靠的现有技术,但是它也许可以将我们引向有据可查的信息。事实上,一且经过深入探究,不起眼的参考文献或许就是一颗宝石。

于是你连通互联网,并打算通过面前的大规模信息高速公路开始检索。从何处下手呢?在Google(www.googlecom)中输入关键词也许可以作为起点。

截至目前,Goge仍然是最流行的互联网搜索引,占据全球搜素引市场50%以上的份额。它虽然出色但并不完美。Google运行于数千台计算机的分布式网络,可进行高速并行处理。简单地说,并行处理就是同时使用至少2个中央处理器(CPU)执行程序一一种可以显著提高数据处理速度的方法。

一种搜索并提取网页的网Google有三个独特模块,包括网络爬虫),“ ndexer'”(可提取每个网页上的单词并存储在数据库中)和Query Processor”(将输人的搜索文本与数据库对比并表明关联性)。下面,

我们将详细介绍这些模块,并探讨它们与非专利文献之间的关系。

Googlebot是一种抓取机器人,不断地查看并搜集网页编入 indexer。有些人将网络形容为一张由随机网址相互连接起来的巨大蜘蛛网,而 Google bot就是穿行于其中并收集信息的蜘蛛。 但实际上, Googlebot并不在网络间穿行,它只是向网页的服务器发送请求,然后下载全部页而并传递给inde xer, Googlebot非常高效,尤其是对在一段时间内保持不变的信息。事实上,检素的内容都来自于过去,因此你或许会发现不复存在或已经过时的信息。另外,我们所说的蜘蛛也许爬得还不够远,尚未到达特定的网页,所以网页的索引日期也很关键。以上这些对检索的总体效率而言都至关重要,所以使用 Google的检索人员还应当有其他来源。

Indexer y将来自 Googlebot的网页存储在 Google的索引数据库中。索引按照检索词的字母顺序排列,可以快速访问包含用户查询条件的文件。为了提高速度,被称为“停用词( stop word)”的常见单词不会被编入索引,比如is、on、or、df、how和why等。

如果没有 Query processor, Indexer将百无一用。Query processor可以评估输人的检索字符串并与相关文件匹配。本文不会探讨 Google的优先级间题,但如果网页中的检索词与查询条件的顺序相同而且彼此接近,那么Google会为该网页分配更高的优先级。

除页面文本外, Google还将超链接代码( HTML code)编入索引,所以用户能够基于检索词的位置限定检索(比如,在标题中、URL.中、正文中或页面链接中一由高级检索页面和搜索算子提供的选项)。


更多“专利”相关内容

更多“专利”相关内容

新知精选

更多新知精选