<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Java堂 &#187; SearchEngine</title>
	<atom:link href="http://www.javatang.com/archives/category/search-engine/feed" rel="self" type="application/rss+xml" />
	<link>http://www.javatang.com</link>
	<description>Java Tang</description>
	<lastBuildDate>Tue, 07 Sep 2010 03:26:23 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Apache+Resin下如何写伪静态和301跳转</title>
		<link>http://www.javatang.com/archives/2008/10/18/1942276.html</link>
		<comments>http://www.javatang.com/archives/2008/10/18/1942276.html#comments</comments>
		<pubDate>Sat, 18 Oct 2008 19:19:42 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[Web&Server]]></category>
		<category><![CDATA[apache]]></category>
		<category><![CDATA[resin]]></category>
		<category><![CDATA[seo]]></category>

		<guid isPermaLink="false">http://www.javatang.com/archives/2008/10/18/1942276.html</guid>
		<description><![CDATA[目前网上大多数资料都是介绍如何在Apache中设置伪静态的，在Resin中很少提及，经过实践实现了这一点，现在做如下总结。 1. Apache下如何写伪静态和301重定向 直接上代码（以本站域名为例）： &#60;IfModule mod_rewrite.c&#62; &#160;&#160; &#160;RewriteEngine On &#160;&#160; &#160;# 叹号表示非，L表示最终结果，不再循环；NC是不区分大小写。 &#160;&#160; &#160;RewriteCond %{http_host} !^www.javatang.com [NC] &#160;&#160; &#160;RewriteRule ^/(.*)$ http://www.javatang.com/$1 [R=301,NC,L] &#160;&#160; &#160;RewriteRule ^(.*)/index(.*)$ $1/index.html [R=301,NC] &#160; &#60;/IfModule&#62; 2. Resin下如何写伪静态和301重定向 Resin下的重定向也是由伪静态来写的，不过具体一些的话他同页面伪静态是分别由两个tag来完成的，页面伪静态由forward完成，301永久重定向由moved-permanently完成。 下面是具体的代码： &#60;rewrite-dispatch&#62; &#160; &#160; &#160; &#160; &#60;forward&#160;regexp=&#34;^(.*)/archives/([^/]+)/([^/]+).html$&#34; target=&#34;$1/archives.jsp?q=$3&#38;amp;a=$2&#34; /&#62; &#160; &#160; &#160; &#160; &#60;!-- HTTP 301 moved --&#62; &#160; &#160; &#160; &#160; &#60;moved-permanently&#160;regexp=&#34;^(.*)/index(.*)$&#34; [...]]]></description>
			<content:encoded><![CDATA[<p>目前网上大多数资料都是介绍如何在Apache中设置伪静态的，在Resin中很少提及，经过实践实现了这一点，现在做如下总结。</p>
<p><strong>1. Apache下如何写伪静态和301重定向</strong><br />
直接上代码（以本站域名为例）：</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline">&lt;IfModule mod_rewrite.c&gt;</li>
<li>&nbsp;&nbsp; &nbsp;RewriteEngine On</li>
<li>&nbsp;&nbsp; &nbsp;# 叹号表示非，L表示最终结果，不再循环；NC是不区分大小写。</li>
<li>&nbsp;&nbsp; &nbsp;RewriteCond %{http_host} !^www.javatang.com [NC]</li>
<li>&nbsp;&nbsp; &nbsp;RewriteRule ^/(.*)$ http://www.javatang.com/$1 [R=301,NC,L]</li>
<li>&nbsp;&nbsp; &nbsp;RewriteRule ^(.*)/index(.*)$ $1/index.html [R=301,NC]</li>
<li>&nbsp; &lt;/IfModule&gt;</li></ol></div>
<p><strong>2. Resin下如何写伪静态和301重定向</strong><br />
Resin下的重定向也是由伪静态来写的，不过具体一些的话他同页面伪静态是分别由两个tag来完成的，页面伪静态由forward完成，301永久重定向由moved-permanently完成。</p>
<p>下面是具体的代码：</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline"><span style="color: Olive;">&lt;</span><span style="color: Green;">rewrite-dispatch</span><span style="color: Olive;">&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: Olive;">&lt;</span><span style="color: Green;">forward</span><span style="color: Gray;">&nbsp;</span><span style="color: #00008b;">regexp</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">^(.*)/archives/([^/]+)/([^/]+).html$</span><span style="color: #8b0000;">&quot;</span><span style="color: Gray;"> </span><span style="color: #00008b;">target</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">$1/archives.jsp?q=$3</span><span style="color: Navy;">&amp;amp;</span><span style="color: Red;">a=$2</span><span style="color: #8b0000;">&quot;</span><span style="color: Gray;"> </span><span style="color: Olive;">/&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: #ffa500;">&lt;!-- HTTP 301 moved --&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: Olive;">&lt;</span><span style="color: Green;">moved-permanently</span><span style="color: Gray;">&nbsp;</span><span style="color: #00008b;">regexp</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">^(.*)/index(.*)$</span><span style="color: #8b0000;">&quot;</span><span style="color: Gray;"> </span><span style="color: #00008b;">target</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">$1/index.html</span><span style="color: #8b0000;">&quot;</span><span style="color: Olive;">/&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; </span><span style="color: Olive;">&lt;/</span><span style="color: Green;">rewrite-dispatch</span><span style="color: Olive;">&gt;</span></li></ol></div>
<p>这里需要特别注意的一点就是地址中的QueryString中&#038;连接符需要使用&amp;来代替，否则为出现错误。</p>
<p>因为JavaEE默认的web.xml文件不支持上述属性，所以可以在你的站点WEB-INF目录下创建一个resin-web.xml文件，这个文件会被Resin看作为站点配置文件，然后在文件中写下如下内容：</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline"><span style="color: Olive;">&lt;</span><span style="color: Green;">web-app</span><span style="color: Gray;"> </span><span style="color: #00008b;">xmlns</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">http://caucho.com/ns/resin</span><span style="color: #8b0000;">&quot;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp;&nbsp; </span><span style="color: #00008b;">xmlns:resin</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">http://caucho.com/ns/resin/core</span><span style="color: #8b0000;">&quot;</span><span style="color: Olive;">&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; </span><span style="color: Olive;">&lt;</span><span style="color: Green;">rewrite-dispatch</span><span style="color: Olive;">&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: Olive;">&lt;</span><span style="color: Green;">forward</span><span style="color: Gray;">&nbsp;</span><span style="color: #00008b;">regexp</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">^(.*)/archives/([^/]+)/([^/]+).html$</span><span style="color: #8b0000;">&quot;</span><span style="color: Gray;"> </span><span style="color: #00008b;">target</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">$1/archives.jsp?q=$3</span><span style="color: Navy;">&amp;amp;</span><span style="color: Red;">a=$2</span><span style="color: #8b0000;">&quot;</span><span style="color: Gray;"> </span><span style="color: Olive;">/&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: #ffa500;">&lt;!-- HTTP 301 moved --&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: Olive;">&lt;</span><span style="color: Green;">moved-permanently</span><span style="color: Gray;">&nbsp;</span><span style="color: #00008b;">regexp</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">^(.*)/index(.*)$</span><span style="color: #8b0000;">&quot;</span><span style="color: Gray;"> </span><span style="color: #00008b;">target</span><span style="color: Gray;">=</span><span style="color: #8b0000;">&quot;</span><span style="color: Red;">$1/index.html</span><span style="color: #8b0000;">&quot;</span><span style="color: Olive;">/&gt;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; </span><span style="color: Olive;">&lt;/</span><span style="color: Green;">rewrite-dispatch</span><span style="color: Olive;">&gt;</span></li>
<li><span style="color: Olive;">&lt;/</span><span style="color: Green;">web-app</span><span style="color: Olive;">&gt;</span></li></ol></div>
<p><strong>3. Apache+Resin组合的时候设置伪静态需要注意的地方</strong></p>
<p>二者组合中Resin主要完成Servlet所映射的地址为文件类型，而Apache完成其余部分，因此关于页面伪静态部分需要在Resin和Apache中同时设置才有效，否则有时候会出现404错误。但对于301永久重定向来说，如果是涉及域名部分的只需要在Apache中设置即可，如果二者都设置的时候会出现域名解析错误；如果涉及到页面部分的话需要在二者中都设置。</p>
<p>关于Resin如何同Apache组合请看这篇文章 <a href="http://www.javatang.com/archives/2006/08/21/010658.html" target="_blank">Resin 3.0.x 经验总结</a></p>
<p>关于Resin+Apache下如何设置泛域名请看这篇文章 <a href="http://www.javatang.com/archives/2008/03/18/2532264.html" target="_blank">Apache+Resin泛域名的设置</a></p>
<p>参考资料：<br />
<a href="http://www.caucho.com/resin/doc/rewrite-tags.xtp#moved-permanently" target="_blank">Resin url rewrite tags</a><br />
<a href="http://www.fosoo.cn/linux/16" target="_blank">Apache网站301永久重定向设置</a></p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2008/03/18/2532264.html" rel="bookmark" class="crp_title">Apache+Resin泛域名的设置</a></li><li><a href="http://www.javatang.com/archives/2007/06/20/1513177.html" rel="bookmark" class="crp_title">Apache和Resin产生大容量日志的解决办法</a></li><li><a href="http://www.javatang.com/archives/2006/08/21/010658.html" rel="bookmark" class="crp_title">Resin 3.0.x 经验总结</a></li><li><a href="http://www.javatang.com/archives/2010/08/27/3629451.html" rel="bookmark" class="crp_title">Apache和Resin组合时UrlRewriteFilter失效的解决方法</a></li><li><a href="http://www.javatang.com/archives/2006/03/13/49104.html" rel="bookmark" class="crp_title">修复WordPress进入后台缓慢的问题</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2008/10/18/1942276.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lucene创建索引时出现的segments或deletable拒绝访问异常的原因</title>
		<link>http://www.javatang.com/archives/2007/06/14/5433176.html</link>
		<comments>http://www.javatang.com/archives/2007/06/14/5433176.html#comments</comments>
		<pubDate>Thu, 14 Jun 2007 14:54:33 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[JavaPlateform]]></category>
		<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[lucene]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[今天在使用Lucene生成索引的时候，总是在索引的过程中出现下面的异常信息： java.io.IOException: Cannot rename …\segments.new to …\segments …… 或 java.io.IOException: Cannot rename …\deletable.new to …\deletable …… 逐一检查了代码、系统目录权限等方面均没有发现问题的所在。后来Google了一下，终于知道原因在杀毒软件的病毒防火墙上面。因为Lucene在生成索引的过程中频繁的创建合并文件，这样病毒防火墙不断地进行监测分析，这个时候就会锁定某个文件，造成Lucene无法进行操作。貌似卡巴斯基的这个问题最严重，呵呵 另外如果关闭病毒防火墙之后依然出现上述异常的话就设置每500条数据就使用optimize()方法对索引优化一次；如果依然出现问题的话那应该更新你的Lucene和lucene analyzers包，因为Lucene2.0有这个bug。我将两个包都更新到最新的2.1版本(2007.4.17)之后运行程序一直没有出现上面的异常提示。 最后总结一下解决的方法，逐一按照一下步骤进行操作： 1) 关闭病毒防火墙； 2) 每500条数据就使用optimize()方法对索引优化依次； 3) 更新Lucene和Analyzers为2.1版本。 参考资料： Lucene 的一个错误 和一个文件太多 各类读者问题汇总 Related Posts:Lucene发布2.1版本GOOGLE服务列表使用java.util.zip对字符串进行压缩和解压缩搜索引擎登陆Lucene中文分词 “庖丁解牛”]]></description>
			<content:encoded><![CDATA[<p>今天在使用Lucene生成索引的时候，总是在索引的过程中出现下面的异常信息：</p>
<blockquote><p>java.io.IOException: Cannot rename …\segments.new to …\segments<br />
……</p>
<p>或<br />
java.io.IOException: Cannot rename …\deletable.new to …\deletable<br />
……</p></blockquote>
<p>逐一检查了代码、系统目录权限等方面均没有发现问题的所在。后来<a target="_blank" href="http://www.google.cn/search?complete=1&amp;hl=zh-CN&amp;newwindow=1&amp;client=aff-cs-maxthon&amp;hs=5UU&amp;q=Cannot+rename+segments.new+to+segments&amp;btnG=Google+%E6%90%9C%E7%B4%A2&amp;meta=">Google了一下</a>，终于知道原因在杀毒软件的病毒防火墙上面。因为Lucene在生成索引的过程中频繁的创建合并文件，这样病毒防火墙不断地进行监测分析，这个时候就会锁定某个文件，造成Lucene无法进行操作。貌似卡巴斯基的这个问题最严重，呵呵</p>
<p>另外如果关闭病毒防火墙之后依然出现上述异常的话就设置每500条数据就使用optimize()方法对索引优化一次；如果依然出现问题的话那应该更新你的Lucene和lucene analyzers包，因为Lucene2.0有这个bug。我将两个包都更新到最新的<a target="_blank" href="http://lucene.apache.org/java/docs/index.html#17+February+2007+-+Release+2.1+available">2.1版本(2007.4.17)</a>之后运行程序一直没有出现上面的异常提示。</p>
<p>最后总结一下解决的方法，逐一按照一下步骤进行操作：</p>
<p>1) 关闭病毒防火墙；<br />
2) 每500条数据就使用optimize()方法对索引优化依次；<br />
3) 更新Lucene和Analyzers为2.1版本。</p>
<p>参考资料：<br />
<a target="_blank" href="http://hi.baidu.com/litertiger/blog/item/0ab1b51c23df538a86d6b622.html">Lucene 的一个错误 和一个文件太多</a><br />
<a target="_blank" href="http://www.rzchina.net/dispbbs.asp?boardid=4&amp;id=13&amp;star=1&amp;page=1#45">各类读者问题汇总</a></p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2007/03/03/2611104.html" rel="bookmark" class="crp_title">Lucene发布2.1版本</a></li><li><a href="http://www.javatang.com/archives/2006/09/18/365065.html" rel="bookmark" class="crp_title">GOOGLE服务列表</a></li><li><a href="http://www.javatang.com/archives/2006/08/30/285461.html" rel="bookmark" class="crp_title">使用java.util.zip对字符串进行压缩和解压缩</a></li><li><a href="http://www.javatang.com/archives/2006/04/13/245817.html" rel="bookmark" class="crp_title">搜索引擎登陆</a></li><li><a href="http://www.javatang.com/archives/2007/03/03/5603105.html" rel="bookmark" class="crp_title">Lucene中文分词 “庖丁解牛”</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2007/06/14/5433176.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lucene中文分词 “庖丁解牛”</title>
		<link>http://www.javatang.com/archives/2007/03/03/5603105.html</link>
		<comments>http://www.javatang.com/archives/2007/03/03/5603105.html#comments</comments>
		<pubDate>Sat, 03 Mar 2007 07:56:03 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[JavaPlateform]]></category>
		<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[分词]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[一位网名为Qieqie的网友在JaveEye上发布了自己写的Lucene中文分词包－庖丁解牛。 高效率：我的赛扬PC 1 秒解析 &#62;&#62;&#62; 20000汉字的词语 (实际测试结果数据，可达1秒10万+汉字。) 高可维护性：使用“庖丁”隐喻，形象明晰 高灵活性，可扩展：OOD 主要发布文件如下： Paoding.rar 中文分词“庖丁解牛”，面向对象，高效率，高扩展性 HashBinaryDictionary.java.rar 原来的HashBinaryDictionary.java使用对第一个字符hash+二份查找。这个算法已经不错。但下面的更新使用了更好的策略。可连续hash词语的字符。理论上这个词典算法应该到达极致了。覆盖HashBinaryDictionary.java在com/sohospace/dictionary下 Main1.java.rar 对一个长度2185856的字符串(4,347,520字节)的分词效率测试。 下载解压后添加到源文件中 Related Posts:PHP中出现“Unable to load dynamic library”问题的解决方法Lucene创建索引时出现的segments或deletable拒绝访问异常的原因由MyEclipse内存不足谈谈JVM内存“终端服务超出最大允许连接数”问题产生原因及解决方法查找接口实现类的Eclipse插件]]></description>
			<content:encoded><![CDATA[<p class="storycontent">一位网名为Qieqie的网友在<a target="_blank" href="http://www.javaeye.com/topic/49441?page=1">JaveEye</a>上发布了自己写的Lucene中文分词包－庖丁解牛。</p>
<blockquote><p>高效率：我的赛扬PC 1 秒解析 &gt;&gt;&gt; 20000汉字的词语 (实际测试结果数据，可达1秒10万+汉字。)<br />
高可维护性：使用“庖丁”隐喻，形象明晰<br />
高灵活性，可扩展：OOD</p></blockquote>
<p><strong>主要发布文件如下：</strong></p>
<p><ins dateTime="2007-03-03T07:58:17+00:00">Paoding.rar</ins><br />
中文分词“庖丁解牛”，面向对象，高效率，高扩展性</p>
<p><ins dateTime="2007-03-03T07:58:17+00:00">HashBinaryDictionary.java.rar</ins><br />
原来的HashBinaryDictionary.java使用对第一个字符hash+二份查找。这个算法已经不错。但下面的更新使用了更好的策略。可连续hash词语的字符。理论上这个词典算法应该到达极致了。覆盖HashBinaryDictionary.java在com/sohospace/dictionary下</p>
<p><ins dateTime="2007-03-03T07:58:17+00:00">Main1.java.rar</ins><br />
对一个长度2185856的字符串(4,347,520字节)的分词效率测试。 下载解压后添加到源文件中</p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2007/07/04/1548182.html" rel="bookmark" class="crp_title">PHP中出现“Unable to load dynamic library”问题的解决方法</a></li><li><a href="http://www.javatang.com/archives/2007/06/14/5433176.html" rel="bookmark" class="crp_title">Lucene创建索引时出现的segments或deletable拒绝访问异常的原因</a></li><li><a href="http://www.javatang.com/archives/2007/12/03/1653250.html" rel="bookmark" class="crp_title">由MyEclipse内存不足谈谈JVM内存</a></li><li><a href="http://www.javatang.com/archives/2007/11/02/0146237.html" rel="bookmark" class="crp_title">“终端服务超出最大允许连接数”问题产生原因及解决方法</a></li><li><a href="http://www.javatang.com/archives/2007/07/04/4045184.html" rel="bookmark" class="crp_title">查找接口实现类的Eclipse插件</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2007/03/03/5603105.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lucene发布2.1版本</title>
		<link>http://www.javatang.com/archives/2007/03/03/2611104.html</link>
		<comments>http://www.javatang.com/archives/2007/03/03/2611104.html#comments</comments>
		<pubDate>Sat, 03 Mar 2007 07:26:11 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[JavaPlateform]]></category>
		<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[lucene]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[近日发现Lucene发布了最新的2.1版本，发布日期为2007年2月17日（春节前一天:)）。由官方上公布的新闻中了解到这次更新最大的改变就是索引的格式发生了修改，新的索引格式2.1版本之前的Lucene无法进行读取，但是新版本的Lucene可以读取原来旧的索引文件。 这里是一份完整的更新列表文件。 Related Posts:Lucene创建索引时出现的segments或deletable拒绝访问异常的原因Apache Tomcat 发布6.0正式版Apache+Resin下如何写伪静态和301跳转Apache+Resin泛域名的设置Apache2 服务因 1 (0×1) 服务性错误而停止 的问题]]></description>
			<content:encoded><![CDATA[<p>近日发现<a target="_blank" href="http://lucene.apache.org/">Lucene</a>发布了最新的2.1版本，发布日期为2007年2月17日（春节前一天:)）。由官方上公布的新闻中了解到这次更新最大的改变就是索引的格式发生了修改，新的索引格式2.1版本之前的Lucene无法进行读取，但是新版本的Lucene可以读取原来旧的索引文件。</p>
<p><a target="_blank" href="http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_1_0/CHANGES.txt">这里</a>是一份完整的更新列表文件。</p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2007/06/14/5433176.html" rel="bookmark" class="crp_title">Lucene创建索引时出现的segments或deletable拒绝访问异常的原因</a></li><li><a href="http://www.javatang.com/archives/2007/03/04/0316106.html" rel="bookmark" class="crp_title">Apache Tomcat 发布6.0正式版</a></li><li><a href="http://www.javatang.com/archives/2008/10/18/1942276.html" rel="bookmark" class="crp_title">Apache+Resin下如何写伪静态和301跳转</a></li><li><a href="http://www.javatang.com/archives/2008/03/18/2532264.html" rel="bookmark" class="crp_title">Apache+Resin泛域名的设置</a></li><li><a href="http://www.javatang.com/archives/2007/07/23/5805183.html" rel="bookmark" class="crp_title">Apache2 服务因 1 (0×1) 服务性错误而停止 的问题</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2007/03/03/2611104.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>一个非常不错的 Spider 程序 &#8211; weblech</title>
		<link>http://www.javatang.com/archives/2006/09/18/031568.html</link>
		<comments>http://www.javatang.com/archives/2006/09/18/031568.html#comments</comments>
		<pubDate>Sun, 17 Sep 2006 19:03:15 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[JavaPlateform]]></category>
		<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[spider]]></category>
		<category><![CDATA[weblech]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[weblech是一个使用 Java 实现的 Spider 程序，简单明了，是研究 Spider 程序原理和 Java 实现一个非常好的项目。官方地址：http://weblech.sourceforge.net/ 另外目前发行的 Weblech 程序有一个非常明显的 bug，就是如果设置多个线程，当下载第一个URL时（一般是网站主页），如果等待时间过长，那么其他线程要么会认为网站已下载完而结束，要么会在下面标*代码处抛出NullPointerException。解决的方法很简单，只要在 nextURL = queue.getNextInQueue(); 后面加一个空值判断就可以了： synchronized(queue) {&#160; &#160; &#160; nextURL = queue.getNextInQueue(); &#160; &#160; if(nextURL == null)&#160; &#160; &#160; &#160; &#160; continue; &#160; &#160; downloadsInProgress++; } 参考资料： 发现weblech的一个Bug（多线程） http://www.blogjava.net/Andyluo/archive/2006/02/16/31013.html Related Posts:Oracle中的”值和null以及java中的null区别在URLHttpConnection中使用代理服务器一个理解“单例模式”最好的例子Eclipse3.1中lomboz3.1的配置和开发遇到一个JDK5.0 Update7 以前的bug]]></description>
			<content:encoded><![CDATA[<p>weblech是一个使用 Java 实现的 Spider 程序，简单明了，是研究 Spider 程序原理和 Java 实现一个非常好的项目。官方地址：http://weblech.sourceforge.net/</p>
<p>另外目前发行的 Weblech 程序有一个非常明显的 bug，就是如果设置多个线程，当下载第一个URL时（一般是网站主页），如果等待时间过长，那么其他线程要么会认为网站已下载完而结束，要么会在下面标*代码处抛出NullPointerException。解决的方法很简单，只要在 nextURL = queue.getNextInQueue(); 后面加一个空值判断就可以了：</p>
<div class="hl-surround"><ol class="hl-main ln-show" title="Double click to hide line number." ondblclick = "linenumber(this)"><li class="hl-firstline"><span style="color: Green;">synchronized</span><span style="color: Olive;">(</span><span style="color: Blue;">queue</span><span style="color: Olive;">)</span><span style="color: Gray;"> </span><span style="color: Olive;">{</span><span style="color: Gray;">&nbsp;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; </span><span style="color: Blue;">nextURL</span><span style="color: Gray;"> = </span><span style="color: Blue;">queue</span><span style="color: Gray;">.</span><span style="color: Blue;">getNextInQueue</span><span style="color: Olive;">()</span><span style="color: Gray;">; </span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; </span><span style="color: Green;">if</span><span style="color: Olive;">(</span><span style="color: Blue;">nextURL</span><span style="color: Gray;"> == </span><span style="color: Green;">null</span><span style="color: Olive;">)</span><span style="color: Gray;">&nbsp;</span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; &nbsp; &nbsp; </span><span style="color: Green;">continue</span><span style="color: Gray;">; </span></li>
<li><span style="color: Gray;">&nbsp; &nbsp; </span><span style="color: Blue;">downloadsInProgress</span><span style="color: Gray;">++; </span></li>
<li><span style="color: Olive;">}</span></li></ol></div>
<p>参考资料：<br />
发现weblech的一个Bug（多线程）<br />
<a target="_blank" href="http://www.blogjava.net/Andyluo/archive/2006/02/16/31013.html">http://www.blogjava.net/Andyluo/archive/2006/02/16/31013.html</a></p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2006/06/13/242443.html" rel="bookmark" class="crp_title">Oracle中的”值和null以及java中的null区别</a></li><li><a href="http://www.javatang.com/archives/2006/08/28/231560.html" rel="bookmark" class="crp_title">在URLHttpConnection中使用代理服务器</a></li><li><a href="http://www.javatang.com/archives/2006/06/27/512049.html" rel="bookmark" class="crp_title">一个理解“单例模式”最好的例子</a></li><li><a href="http://www.javatang.com/archives/2006/03/12/11063.html" rel="bookmark" class="crp_title">Eclipse3.1中lomboz3.1的配置和开发</a></li><li><a href="http://www.javatang.com/archives/2006/10/10/444472.html" rel="bookmark" class="crp_title">遇到一个JDK5.0 Update7 以前的bug</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2006/09/18/031568.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>GOOGLE服务列表</title>
		<link>http://www.javatang.com/archives/2006/09/18/365065.html</link>
		<comments>http://www.javatang.com/archives/2006/09/18/365065.html#comments</comments>
		<pubDate>Sun, 17 Sep 2006 18:36:50 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[News&Analysis]]></category>
		<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[google]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[Google GWT 查看指定网页的手机显示效果 http://www.google.com/gwt/n Google SiteMaps https://www.google.com/webmasters/sitemaps Google Ad Sense https://www.google.com/adsense/ Google AdWords https://adwords.google.com/select Google分析 http://google.com/analytics/ Google问答 http://answers.google.com/ GoogleBase http://base.google.com/ Google博客搜索 http://blogsearch.google.com/ Google书签 http://www.google.com/bookmarks/ Google图书搜索 http://books.google.com/ Google日历 http://google.com/calendar/ Google目录 http://catalogs.google.com/ Google代码 http://code.google.com/ Google桌面工具条 http://deskbar.google.com/ Google桌面 http://desktop.google.com/ Google网页目录 http://www.google.com/dirhp Google地球 http://earth.google.com/ Google股票 http://finance.google.com/ Google网上论坛 http://groups.google.com/ Google图片搜索 http://images.google.com/ Google实验室 http://labs.google.com/ Google本地搜索 http://local.google.com/ Google地图 http://maps.google.com/ Google火星 http://www.google.com/mars/ Google移动 [...]]]></description>
			<content:encoded><![CDATA[<p class="storycontent">Google GWT 查看指定网页的手机显示效果 http://www.google.com/gwt/n</p>
<p>Google SiteMaps https://www.google.com/webmasters/sitemaps</p>
<p>Google Ad Sense https://www.google.com/adsense/</p>
<p>Google AdWords https://adwords.google.com/select</p>
<p>Google分析 http://google.com/analytics/</p>
<p>Google问答 http://answers.google.com/</p>
<p>GoogleBase http://base.google.com/</p>
<p>Google博客搜索 http://blogsearch.google.com/</p>
<p>Google书签 http://www.google.com/bookmarks/</p>
<p>Google图书搜索 http://books.google.com/</p>
<p>Google日历 http://google.com/calendar/</p>
<p>Google目录 http://catalogs.google.com/</p>
<p>Google代码 http://code.google.com/</p>
<p>Google桌面工具条 http://deskbar.google.com/</p>
<p>Google桌面 http://desktop.google.com/</p>
<p>Google网页目录 http://www.google.com/dirhp</p>
<p>Google地球 http://earth.google.com/</p>
<p>Google股票 http://finance.google.com/</p>
<p>Google网上论坛 http://groups.google.com/</p>
<p>Google图片搜索 http://images.google.com/</p>
<p>Google实验室 http://labs.google.com/</p>
<p>Google本地搜索 http://local.google.com/</p>
<p>Google地图 http://maps.google.com/</p>
<p>Google火星 http://www.google.com/mars/</p>
<p>Google移动 http://mobile.google.com/</p>
<p>Google月球 http://moon.google.com/</p>
<p>Google电影 http://www.google.com/movies</p>
<p>Google音乐 http://www.google.com/musicsearch</p>
<p>Google新闻 http://news.google.com/</p>
<p>Google软件包 http://pack.google.com/</p>
<p>Google网页创作 http://pages.google.com/</p>
<p>Google个性化主页 http://www.google.com/ig</p>
<p>Google个性化搜索 http://labs.google.com/personalized</p>
<p>Google阅读器 http://www.google.com/reader</p>
<p>Google学术搜索 http://scholar.google.com/</p>
<p>Google搜索历史 http://www.google.com/searchhistory</p>
<p>Google短信服务 http://www.google.com/sms/</p>
<p>Google提示 http://www.google.com/webhp?complete=1</p>
<p>GoogleTalk http://talk.google.com/</p>
<p>Google工具条 http://toolbar.google.com/</p>
<p>Google旅行计划者 http://www.google.com/transit</p>
<p>Google翻译工具 http://www.google.com/translate_t</p>
<p>Google视频 http://video.google.com</p>
<p>Google网页加速器 http://webaccelerator.google.com</p>
<p>Google Web API http://www.google.com/apis</p>
<p>Google网页搜索 http://www.google.com</p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2007/03/12/5833125.html" rel="bookmark" class="crp_title">Google发布“网站导航”</a></li><li><a href="http://www.javatang.com/archives/2010/01/19/4754372.html" rel="bookmark" class="crp_title">离线版Google Chrome Frame下载</a></li><li><a href="http://www.javatang.com/archives/2010/07/11/4201420.html" rel="bookmark" class="crp_title">彻底修改Google Chrome浏览器的安装目录</a></li><li><a href="http://www.javatang.com/archives/2007/11/28/1236247.html" rel="bookmark" class="crp_title">谈谈网络存储服务</a></li><li><a href="http://www.javatang.com/archives/2006/04/13/245817.html" rel="bookmark" class="crp_title">搜索引擎登陆</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2006/09/18/365065.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>搜索引擎登陆</title>
		<link>http://www.javatang.com/archives/2006/04/13/245817.html</link>
		<comments>http://www.javatang.com/archives/2006/04/13/245817.html#comments</comments>
		<pubDate>Thu, 13 Apr 2006 07:24:58 +0000</pubDate>
		<dc:creator>Jet</dc:creator>
				<category><![CDATA[SearchEngine]]></category>
		<category><![CDATA[搜索引擎]]></category>

		<guid isPermaLink="false"></guid>
		<description><![CDATA[Google、baidu等搜索引擎的站点登陆口: goole: http://www.google.com/addurl/?hl=zh-CN&#038;continue=/addurl baidu: http://www.baidu.com/search/url_submit.html yahoo: http://search.yahoo.com/info/submit.html yahoo中国：http://search.help.cn.yahoo.com/h4_4.html 搜狗: http://db.sohu.com/regurl/regform.asp?Step=REGFORM&#038;class= 中搜： http://202.108.33.161/web/frontward/free/free_speedlogin.asp Tom搜索： http://search.tom.com/tools/weblog/log.php 一搜：http://www.yisou.com/search_submit.html?source=yisou_www_hp hao123: http://post.baidu.com/f?kw=hao123 天网：http://www.infomall.cn/url_submit.html Related Posts:Lucene创建索引时出现的segments或deletable拒绝访问异常的原因GOOGLE服务列表提高页面相应速度之压缩优化js和css文件Google发布“网站导航”好词!]]></description>
			<content:encoded><![CDATA[<p>Google、baidu等搜索引擎的站点登陆口:</p>
<p>goole: <a href="http://www.google.com/addurl/?hl=zh-CN&#038;continue=/addurl" target="_blank">http://www.google.com/addurl/?hl=zh-CN&#038;continue=/addurl</a><br />
baidu: <a href="http://www.baidu.com/search/url_submit.html" target="_blank">http://www.baidu.com/search/url_submit.html</a><br />
yahoo: <a href="http://search.yahoo.com/info/submit.html" target="_blank">http://search.yahoo.com/info/submit.html</a><br />
yahoo中国：<a href="http://search.help.cn.yahoo.com/h4_4.html" target="_blank">http://search.help.cn.yahoo.com/h4_4.html</a><br />
搜狗: <a href="http://db.sohu.com/regurl/regform.asp?Step=REGFORM&#038;class=" target="_blank">http://db.sohu.com/regurl/regform.asp?Step=REGFORM&#038;class=</a><br />
中搜： http://202.108.33.161/web/frontward/free/free_speedlogin.asp<br />
Tom搜索： http://search.tom.com/tools/weblog/log.php<br />
一搜：http://www.yisou.com/search_submit.html?source=yisou_www_hp<br />
hao123: http://post.baidu.com/f?kw=hao123<br />
天网：http://www.infomall.cn/url_submit.html</p>
<div id="crp_related"><h2>Related Posts:</h2><ul><li><a href="http://www.javatang.com/archives/2007/06/14/5433176.html" rel="bookmark" class="crp_title">Lucene创建索引时出现的segments或deletable拒绝访问异常的原因</a></li><li><a href="http://www.javatang.com/archives/2006/09/18/365065.html" rel="bookmark" class="crp_title">GOOGLE服务列表</a></li><li><a href="http://www.javatang.com/archives/2008/04/13/0212267.html" rel="bookmark" class="crp_title">提高页面相应速度之压缩优化js和css文件</a></li><li><a href="http://www.javatang.com/archives/2007/03/12/5833125.html" rel="bookmark" class="crp_title">Google发布“网站导航”</a></li><li><a href="http://www.javatang.com/archives/2006/04/07/542415.html" rel="bookmark" class="crp_title">好词!</a></li></ul></div>]]></content:encoded>
			<wfw:commentRss>http://www.javatang.com/archives/2006/04/13/245817.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

<!-- Performance optimized by W3 Total Cache. Learn more: http://www.w3-edge.com/wordpress-plugins/


Served from: www.javatang.com @ 2010-09-10 09:50:59 -->