Plone 使用漏斗网导入而不更改url

Plone 使用漏斗网导入而不更改url,plone,plone-funnelweb,Plone,Plone Funnelweb,我已经将一些网页从互联网上的一个站点导入到我的plone站点。现在的问题是,当导入到plone时,它会更改url,这导致plone无法定位文件。因此,在导入之前,以下是其中一个URL的外观示例: 导入之后,它看起来是这样的: http://localhost:8080/Scandiatransplant/wiki/index.html?What_Is_Scandiatransplant 显然这是个问题,因为没有名为index.html的选项? 有办法解决这个问题吗?我在想,也许可以通过在pi

我已经将一些网页从互联网上的一个站点导入到我的plone站点。现在的问题是,当导入到plone时,它会更改url,这导致plone无法定位文件。因此,在导入之前,以下是其中一个URL的外观示例:

导入之后,它看起来是这样的:

http://localhost:8080/Scandiatransplant/wiki/index.html?What_Is_Scandiatransplant
显然这是个问题,因为没有名为index.html的选项? 有办法解决这个问题吗?我在想,也许可以通过在pipeline.cfg文件中添加一个步骤来修复它,告诉您不要更改url?不过这只是一个猜测。我还没有做管道.cfg。该网站:解释说可以创建一个pipeline.cfg文件,但它不告诉在哪里放置该文件。我应该把这个文件放在哪里

最后。。。它可以通过正则表达式表示,在导入过程中忽略哪些文件,但我没有告诉funnelweb忽略任何文件。它仍然没有导入图像、pdf文件、xslt等。有人也经历过这种情况吗

所以,总结一下我的问题

  • 我应该将pipeline.cfg文件放在哪里

  • 如何使plone/漏斗不更改url,但在导入时保持相同的url

  • 如何让漏斗网同时导入图像和pdf文件

  • 您可以将pipeline.cfg文件放在任何位置;您可以从命令行告诉
    funnelweb
    在哪里可以找到它:

    bin/funnelweb --pipeline=path/to/your/pipeline.cfg
    
  • 这更为复杂。您的目标站点是一个Wiki,页面名称是其中查询字符串的一部分。
    ?What_Is_Scandiatransplant
    需要用作新Plone页面的id,其他页面中使用的URL需要重写以匹配

    您当然可以在管道中这样做,但是比这里容易写的要复杂一些。请按照
    漏斗网
    的文档进行操作(
    urltidy
    组件将帮助您重写URL),并随时就您在此处遇到的问题提出具体问题

  • 检查日志,看看漏斗网已经找到并上传了什么。您可能需要调整webcrawler设置;这因场地而异。没有更多关于这个网站的细节,我只能给你这个一般性的提示


  • 好的,非常感谢,答案确实给了我一些工作。关于问题3,我忘了写下,导入后,图像看起来确实已经上传,它们的真实名称和扩展名(如document.pdf)都在那里,但当我点击它们时,它们只是空的。但我到电脑前会查日志的。谢谢有些事情告诉我,我会带着问题回来回答2:-)你好。我找不到任何关于如何表示您不希望更改导入页面上的URL的示例。有人知道什么有用的资源吗?这是我使用的,它在具体问题上对我没有帮助:。我遇到的另一个问题是,一些导入的页面需要登录。是否有此方面的规则,或者导入后它是否正常工作?我还不能测试这个,因为我的URL问题阻止了我。谢谢,除了提供的文档之外,除了浏览源代码之外,我没有更多的提示或帮助。我自己不使用漏斗网(我是底层transmogrifier框架的作者)。