八爪鱼采集器使用图解,八爪鱼采集软件

  

  如果不能用python写代码收集数据。章鱼一定是国内收藏领域的佼佼者。不需要写代码,简单易懂,可以快速采集,支持云采集。具体可以去官网了解。另外,如果你有国外的收藏需求,可以用章鱼的孪生兄弟Octoparse。收藏国外网站比较快。   

  

  Evernote、数据库、微软OneNote都非常好用,可以很容易地在网上搜索到。Evernote需要在线注册才能使用。破解版的数据库运行的非常好。   

  

  以下是关于几篇知识管理文章的文章   

  

  通过对前文《寻找最好的笔记软件:海选篇》的综合分析,笔者发现三种软件优势明显,可谓“前三的笔记软件”。它们是:EverNote、Mybase和Surfulater。他们的相似点大相径庭,但在各自的风格上却是最强的。三者如何选择,不在于哪一个“更强大”,而在于你是什么样的用户,或者你有什么样的需求。EverNote如果你需要一个方便的地方来存放你的笔记,又没有太多的组织功能和冗余功能,那么EverNote是最适合你的。你可以这样理解。EverNote是一个无限纸卷,上面记录了你所有的笔记。唯一的顺序是根据时间。每一个笔记甚至没有标题――这是其他笔记软件不应该考虑的原则。那听起来不方便。我怎样才能找到我的旧笔记?EverNote作为一款优秀的软件,完美解决了你的顾虑。使用起来没有任何不便,我甚至没有意识到这是个问题。有两种解决方案,即定位/过滤笔记的方法:分类和实时搜索。分类功能如图所示。您可以手动或根据自动规则对笔记进行分类。分类可以安排在一个树形结构中,但这不同于其他类似程序的树形结构。因为一个笔记可以分为多个类别。   

  

  另一种查找笔记的方法是使用实时搜索框。这个功能,在EverNote中实现的如此完美,是我见过最好的软件,速度非常快。当您键入每个字母时,所有匹配的注释将动态显示在下方。不仅如此,所有匹配的单词都会高亮显示。如前所述,所有的笔记都放在一个文件中。如果你想上下翻页,可以点击右边的滚动框。滚动速度取决于点击的位置。或者,您可以使用右边的“时间条”功能。相当于一个立式日历,只需要点击一个日期就可以显示相关评论。如果日期旁边有显示,说明该日期有注释。我觉得用这个功能做电子日记真的很方便。Evernote还可以轻松抓取任何内容,尤其是各种网页内容。准确来说,三巨头中,它抓取网页内容的能力最强。它不仅捕捉到了非常精确的范围,而且内容进入Evernote后,完全像一个笔记,而不是一个网页:鼠标变成了一只小手,点击它会导致一个链接。在EverNote中,如果你想访问链接,你需要双击它。一直对网络点击风格入侵软件界面没什么好感。还记得Windows在操作系统界面引入点击模式的时候吗?我不习惯,所以一直关着。对了,我的基地和冲浪都是点击模式。Mybase这样做是因为它使用IE引擎来显示网页;Surfulater这样做是因为它的界面从头到尾都是web风格。剪辑上还是有些不足。如果真的要对一个笔记做一些网格排列和文字组织,需要进入全屏模式。   

  

  此时,注释将单独显示在一个大窗口中,并使用rtf标准工具栏进行编辑。在普通窗口中,几乎没有编辑按钮。可以进入全屏模式或者右键菜单。另外,图像缩放功能也很奇怪。总的来说,Evernote是“手写和心理搜索”这一类中最好的软件。其最大的优势在于一流的实时搜索功能和强大的网页内容抓取功能。缺点是笔记的组织和编辑功能较弱。Mybase如果用户需要尽可能多的工具/功能来处理笔记,那么Mybase就是首选。在我看来,Mybase是一个演变成现代风格的基调。他们两个在视觉和感觉上都很相似。其界面简洁高效,通过多选项卡和多面板可以有效扩展功能,并具有多种票据处理工具。我用Keynote很久了,然后过渡到Mybase很顺利。除此之外,KeyNote在处理笔记方面也是极其通用的)。Mybase以最简单的树形结构组织笔记,这也是大多数类似软件的标准思路。也就是说,在这方面,Mybase不追求个性,而是保持共性。在最新的v5版本中,Mybase增加了标签功能——有点像Evernote类别或者其他软件关键词。基于分类树,它提供了额外的组织维度。但是它的效果和专门针对它的工具,比如Zoot和Evernote,还是有差距的。当然,最好的部分是Mybase是一个(如果不是唯一的)可以同时具有树和标签功能的软件。   

  

  这就是Mybase的风格和优势:功能和选项最多,定制最大。为了让大家最直观的了解它的功能,下图是它的菜单全部展开后的情况:我们说过,Mybase使用了很多面板,所以显示笔记信息的桌面空间比较小。这与一些软件形成对比。例如,Surfulater使用超链接和网页的功能来处理引用、链接、附件等。在Mybase中,主界面下的独立子窗口/面板用于显示这些元素:结构树、注释体、搜索结果、附件列表和到其他注释的链接。这种做法让一些人感到不舒服,但其他用户可能会欣赏这种分离。我是其中之一。一些通用性比较高的面板,比如附件和其他笔记的链接,可以通过选项设置为自动显示:如果笔记有附件或者外链,就会显示;如果没有,请隐藏这些面板。这时候灵活设置就很实用了,可以最大限度的预留桌面空间。Mybase也可以抓取Firefox或IE的网页内容,但还达不到Evernote或Surfulater的水平。首先,抓取内容不像另一个   

两款软件那样视为普通笔记。让我解释一下,对每条笔记,Mybase都有“文本笔记”和“网页”两个标签。如果是抓取的网页内容,Mybase自动切到网页标签。而对于其他类型的笔记,无论是粘贴进来还是手工输入的,都是在“文本笔记”标签下。

  

myBase 中所有内容均保存为节点的附件文件,所谓笔记(note) 也是保存为一个附件文件,只是被命名为带.RTF 扩展名的特殊项,一般不会显示出来,而且其他内容,如抓取的网页,则直接保存为附件,在附件列表中可以看到网页中的HTML/JS/样式/图片等元素。因此,输入的内容与抓取的网页内容一般是分开显示的;这样的设计给系统扩展带来极大的便利性、灵活性与统一性。实际上,如果需要将note 写入网页中,可以在网页中按F2 或选择Edit -> Toggle Edit Mode 菜单项,即可直接输入或编辑网页内容,这样笔记就可以和抓取的网页显示在同一页上了。这样处理的结果就是,你不能把笔记与网页合在一起。基于此点,我认为Evernote和Surfulater的抓取功能更胜一筹。再有一点美中不足的是,Mybase采用IE而非内置的web引擎来展现抓取的网页内容。因此,当你切换到网页标签时,程序会调用IE而有一个瞬间的停顿。当然,这一问题并不严重,只是不如另外的软件那样平滑集成。目前绝大多数软件都是嵌入IE来显示网页,所不同的是有些软件一启动就装入了IE浏览器,而myBase只在需要浏览网页时才调入IE,因此首次查看网页时有一点停顿,此后就会非常平滑,这样做的目的是为了尽量减少内存和系统资源占用。

  

  Mybase V5也开发了实时搜索功能。这是一项有价值的功能,用起来的效果也不错。当然,它还比不上Evernote的水平,但至少是可用的。再强调一次,这正是Mybase的比较优势:虽不是每项功能都做到了所有软件中这方面的最高水平,但至少让用户在一个软件中,拥有了这么多功能。

  

在最新的myBase v5.3中专门重写了索引模块及搜索技术,加入了可调大小的高速缓存技术,提供了相当高的索引性能,同时支持增量索引、大数据量索引、即时搜索及布尔条件(AND/OR/NOT),对常见的WORD/EXCEL/HTML/PPT/EMAI/TEXT/RTF等多种文档都提供了预置的索引与搜索支持,还可以通过安装第三方过滤器实现更多的文档格式的识别,比如PDF 文档,此外,myBase还特别地提供了一定的中文搜索支持(但还不完善),总的来说我们当前开发的索引技术已经远远超过其他几家,可以用稍大一些的数据作一些测试,比如100MB以上的可索引数据,就可以看出我们付出了相对多的努力来改进这项技术,当然也还需要进一步改进。Mybase还提供了一些扩展的组织功能。它可以条目链接,从而让多个笔记之间互为参考。也可以符号链接,从而让用户在结构树上点击笔记A时,直接进入它链接到的笔记B,就象一个快捷方式一样。我还不能充分理解这一功能的作用,但还是那句话,有比无好。

  

  应该是用于一条笔记进入多个树状分支吧,等同于Evernote的一条笔记进入多个分类然后,它还能自定义标签(label),就象笔记的关键词一样,当你点击关键词时,Mybase会列出归入此关键词的所有笔记。就象我所说的,它为组织笔记提供了一个新维度。正如你所见的,Mybase是此类软件中最灵活、功能最丰富的一个。其他软件与Mybase相比,或许更具有创新性,或许在某些方面更强大,但没有一个能同时拥有Mybase这样多的笔记处理功能。再次重申一下,以前用KeyNote的用户,可以平滑过渡到Mybase。正因如此,我现在已经开始用Mybase来作为当前处理笔记的工具。然后,根据情况最终决定用哪款软件。Surfulater Surfulater的初衷是作为网页抓取和文献管理工具,然后――也是顺理成章地――进入了笔记软件行列。由于这一历史原因,它在界面上与其他笔记软件有很大差异。也就是说,本专题涉及的其他软件从开始就是以笔记为核心功能进行开发,而笔记只是Surfulater功能之一,并且不是最初的主导功能。Surfulater作为一种内容抓取(网页抓取只是其中一方面)和文献管理工具,在这方面做得比谁都好。如果要便捷强大的链接、文献管理,并收录资料,则最适合选择Surfulater。

  

  下面这个场景可作为对Surfulater的最佳描述:你就某一专题在互联网上搜资料,然后找到一个网页,正是你所需要的资料,并且有很多到相关站点的链接。这就是Surfulater软件要做的,并且非常轻松。你可以把各种信息全部收进来,拖拖拽拽,把资料、链接、附件放在一起,不一会儿,你就可以得到一个完整的信息系统,并且具有格式优良的web展示页面、链接,凡你所需,皆在此中。Surfulater的最大强项在于重复性工作的自动完成。在抓取一个网页后,Surfulater会自动填入标题、描述、到原出处的链接、抓取日期。它甚至会为原始网页创建一个缩略图。用户可以把其他笔记拖到当前笔记上,建立快速参考。这一操作同样适用于附件。如同Evernote一样,全部笔记也是前前后后,排成一长列。但是,它的队列线索不象Evernote一样,仅局限于时间,所以要灵活得多。

  

  最让我感兴趣的,是Surfulater的结构树。初看起来,它中规中矩,并无突出之处。但实际上,它拥有目前全部软件中最好的后台引擎。它实际上是一种虚拟的树状结构,可以按不同选项进行配置。笔记可以按用户需求按树状展示,但是也可以象Evernote一样按时间顺序排列。你还可以让结构树不展开末级分支,这样,结构树只展示目录,而不展示笔记条目。重要的一条消息是,开发者提过,在新版本中会允许用户自定义树结构,这意味着一条笔记有可能进入多个分类。 还有一个突出的功能是,Surfulater可以克隆笔记项目。初看起来,它的效果与复制相同。但实际上,它们差别很大。克隆后的副本实际是一种镜像:不重复占用存储空间,但可以逻辑上放在另外一个类别中,并且相互之间实时一致。比如,修改其中的任一个,其他克隆副本会同时更新。最后,一个出色功能是把搜索结果作为一个虚拟的结构树分支,列在树结构的最后面。用户可以在搜索结果中进行浏览、滚动,和正常的树、笔记完全一样。当然,命中的关键词也象Evernote一样高亮显示。对于搜索结果,Evernote也汇集在一起纵向排列,但我认为建立一个列表,可以更方便用户查阅。 接下来是一个小功能,即设定笔记或分支节点的图标,Surfulater在这方面做得非常棒,其他软件与之相比,无不相形见绌。

  

  用户只须右键点击图标,然后就会弹出一个小窗口,展示出所有可用的图标,想选哪个,点击即可。(注1) 接下来,我们说一下Surfulater作为一个笔记软件的不足之处,这些不足的最主要原因就是因为Surfulater的初衷并不是用来做笔记。如果你要编辑笔记,在绝大多数的笔记软件中,只要点击这一笔记,开始输入文字即可。但是到了Surfulater这里,此路不通。你必须要在编辑模式与常规模式间手工切换――这经常令新手无所适从。进入编辑模式的一个办法是,鼠标点住某个输入框持续几秒钟,也就是说,不象一般软件那样点击,而是长按。还有一种进入编辑模式的办法,就是点击每一内容旁边的铅笔图标。值得庆幸的是,作者意识到了这一问题,已经做了改进,并承诺在将来做出进一步的提高。但是,我仍然坚持这样一个原则:笔记软件应当默认处于可编辑状态,只要用户想做编辑,就能马上进行,不能有任何形式和原因的延缓。再一个不足之处是,Surfulater中找不到一个空白的地方直接做笔记。Surfulater中任何文章(也就是笔记)都基于事先定义好的模板。这些模板有头信息,用于保存标题、注释、评级、参照……。这些功能对于学术研究而言,非常有利于管理和组织;而对于普通用户,尤其是只想随手记点东西时,则是一个极不方便的限制。

  

  现在能做的是,选一个“笔记模板”,它只有一个头信息,就是“笔记”,主体部分就是完全空白,用户就在这里做笔记。Surfulater要成为一个真正的笔记工具,其底线就是在上述两方面做出改进:提供一个编辑模式默认开或关的选项,提供一个完全空白的笔记区域。准确地讲,在这些方面,Surfulater必须向标准的――也是实践证明最有效的――笔记软件风格靠拢。总起来看,Surfulater功能丰富而风格独特,最适于大量笔记的引用、导航与抓取。从我的了解和判断来看,律师、学者可能会非常欣赏它。原因嘛,想想它与众不同的功能就会明白。如下的场景也可说明哪些人最适合它:如果你现在正使用Evernote,却发现它在组织管理方面还不够强,那你转向Surfulater就是明智的选择。或者你正在使用任何其他基于最基本的树状结构的笔记软件,而感到处理链接、引用方面力不所心,那也可以转向Surfulater。三强功能对比表上面逐一论述了三强笔记软件的优劣,相信各位读者已经有所认识。如果还嫌不清晰,请看下表。俗话说,不怕不识货,就怕货比货。这一表格并没有涵盖所有功能,但还是能提供不少帮助的。

  

 原作者好象没有注意到myBase 中的强大图标功能,与其他几个程序不同,myBase的图标是开放式的,而且是per database 的实现,也就是说每个DB都可以由用户自行添加任何多的用户自己喜爱的图标,myBase 本身预定义有一套缺省的图标,同时随安装包还提供了一组网上采集的图标,可以方便的引入到任何.nyf库中,并提供了成批为树节点指定/替换图标的工具。不过,需要注意的是,新建的空白.nyf库不会自动引入任何图标,所以初次打开图标框是空的,这时用户可以根据需要引入自己喜爱的图标进入,稍后即可方便指定图标了。

  

有一个seekbytime 插件,可以按修改时间列出项目,同时内置的高级搜索也提供了按时间段搜索,间接实现了按时序展示,而且可以方便的逆排序。在myBase 复杂笔记,即使复杂分枝中所有笔记也都很简单,Ctrl+拖放,或者Copy/Paste,而且分枝可以在不同的库之间复制。myBase 5.x 目前只实现了简单的RTF表格,仅仅好于没有。有只读打开模式,按只读方式打开后,只能查看,不可编辑。按住Ctrl 选择Reopen 项即可切换打开模式。

  

 是否同时显示,取决于是否将笔记写入网页中,在网页中按F2即可进入编辑状态,在网页中添加自己的注释内容。

  

基本都是调用IE展取网页内容,与其他几家不同的是,myBase 只在需要展显网页时才调入IE,这样确保不浪费太多系统资源

相关文章