Php wiktionary-我无法获得本地工作副本

Php wiktionary-我无法获得本地工作副本,php,mysql,wiktionary,Php,Mysql,Wiktionary,我会第一个承认我不是世界上最聪明的人,但我在这一点上不知所措 我想有权访问的话和英语维基词典项目的每个字的细节。 我看到他们做数据转储,非常兴奋。这持续了整整3秒钟。 从那以后,我所做的就是在一阵阵的沮丧和愤怒中咒骂和抽烟 我正在使用Windows7。 我已经安装了最新版本的xampp 64位,安装在根目录下。 我已经安装了最新的javadk。 我已将Xampp和JDK设置为以管理员身份运行。 我抓到了文章页面和文件。 我已经解压了。 我使用了mwxml2sql工具。 无论我尝试了什么设置/标志

我会第一个承认我不是世界上最聪明的人,但我在这一点上不知所措

我想有权访问的话和英语维基词典项目的每个字的细节。 我看到他们做数据转储,非常兴奋。这持续了整整3秒钟。 从那以后,我所做的就是在一阵阵的沮丧和愤怒中咒骂和抽烟

我正在使用Windows7。 我已经安装了最新版本的xampp 64位,安装在根目录下。 我已经安装了最新的javadk。 我已将Xampp和JDK设置为以管理员身份运行。 我抓到了文章页面和文件。 我已经解压了。 我使用了mwxml2sql工具。 无论我尝试了什么设置/标志,我都无法让它运行。 我使用了mwxml2sql工具的GUI版本。 它运行-然后在4300行出错。 错误是关于name_title中的双键

我看过wikokit,但这似乎已经落后了几年

我不知所措

我已经查看了在dupe key错误之前进入数据库的数据。 我可以看到一些Blob格式的数据。 如何通过php访问这些信息

难道没有一个像样的《白痴:D》指南吗? 我真的需要抓取所有文件,安装wiki,解析文件吗? 我应该如何处理复制密钥问题,而不是打开sql文件并找到相关行

那么,请问——有人做过这件事或者知道一种方法吗? 我所能想到的唯一一件事就是实际尝试并删除该网站——我宁愿不这样做,维基小组也不这样做

如果是相关的-我特别关注单词形式、词性、发音、定义、任何短语和相关单词。 词源学等东西会很好,但没有那么重要

如果有人建议,是的,我已经查看了WordNet,找到了一个mysql转储,并使其正常工作。我也看到过类似MRC和CMU dict的资源,但没有一个具有正确的权限。这就是Wiktionary看起来如此吸引人的原因。但格式/转储似乎远不友好:

那么,有什么帮助或想法吗? 其他来源,指南,走查。。。一切都会有帮助。 或者,如果您能告诉我是什么导致了错误,以及如何避免错误,以及如何访问word数据,那就太好了

辛塞利你的-沮丧

我看过wikokit,但这似乎已经落后了几年

否,wikokit项目处于活动状态:链接:


您可以下载已解析的英文维基百科数据库:将SQL转储文件上载到MySQL,并播放从英文维基百科中提取的定义、同义词和翻译。

Hi there Andrew-谢谢您的回复。|我正在尝试使用20150413.sql文件。我创建了一个空数据库,禁用了自动提交、唯一检查和外键,我提高了innodb的内存限制。但它在插入null时出错了我在,再试一次,看看我是否能复制出完整的错误信息;4.5Gb数据/5.6Gb索引中有10.1Gb—上次它崩溃了11.9Gb 5.2Gb/6.7Gb。。。如此接近。。。一旦它出错,我会发布错误我不敢相信我不得不花2个小时才得到一个错误!好的-所以cmd在11.5Gb 5/6.5时崩溃了。。。没有错误信息,只有大量的错误信息。没有比这更好的方法了吗?虽然我想要这些数据,但我可能会更好地删除Wiktionary,因为它浪费了大量的时间在巨大的数据球上闲逛,这只会导致错误。很久以后,cmd窗口抛出了一些可见的错误。。。最上面的一个读作::ERROR 1064:您的SQL语法有一个错误;查看与您的MySQL服务器版本对应的手册,了解使用接近文本值的正确语法。即使使用-f force选项,它仍然失败,几乎在同一点上!但与前面的错误不同,我在第6101行得到了错误2006:MySQL服务器已经消失。。。这是第三次失败了。我只能假设wikokit站点的SQL有问题: