Wordpress 从网页中获取所有链接和图像的最快方法?

Wordpress 从网页中获取所有链接和图像的最快方法?,wordpress,web-scraping,Wordpress,Web Scraping,因此,这不是一个真正的问题,更像是自动完成任务…… 我建立了一个网站,不得不从以前的网页上复制大量内容。我是通过将旧页面的内容复制粘贴到wordpress制作的新页面来实现的 内容中的所有链接和图像仍然指向旧页面。所以我想找到一个类似webscraping的工具,它可以分析所选链接的列表,然后输出指向我的网页之外的所有链接,以及我必须下载的所有图像的列表,考虑到你的新旧网站将具有相同的URL结构,这是一个书签,您可以将其另存为工具栏上的书签 为了让你的工作更简单,打开一个旧的网站页面,只需点击你

因此,这不是一个真正的问题,更像是自动完成任务……
我建立了一个网站,不得不从以前的网页上复制大量内容。我是通过将旧页面的内容复制粘贴到wordpress制作的新页面来实现的


内容中的所有链接和图像仍然指向旧页面。所以我想找到一个类似webscraping的工具,它可以分析所选链接的列表,然后输出指向我的网页之外的所有链接,以及我必须下载的所有图像的列表,考虑到你的新旧网站将具有相同的URL结构,这是一个书签,您可以将其另存为工具栏上的书签

为了让你的工作更简单,打开一个旧的网站页面,只需点击你保存的bookmarklet按钮(代码如下)。此代码将替换从旧网站到新网站的链接。图像将以类似方式处理。接下来,您可以复制更新的内容并将其粘贴到新网站的编辑器(wordpress admin)中

在开发者的控制台上(F12键),你会得到一个你必须下载的所有图像的列表

javascript:(function(){
    var jqscript = document.createElement('script');
    jqscript.onload = function() {
        // treat the <a> tags
        jQuery('#my-content-container').find('a[href^="http://my-old-website.com"]').each(function(i, anchor) {
            jQuery(anchor).attr('href', jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
        });
        // treat the <img> tags, and make a list of images to download
        var images_to_download = [];
        jQuery('#my-content-container').find('img').each(function(i, image) {
            images_to_download.push(jQuery(image).attr('src'));
            jQuery(image).attr('src', jQuery(image).attr('src').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
        });
        // output a list of images to the developer console
        console.log(images_to_download);
    };
    jqscript.src = "//ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js";
}());
javascript:(函数(){
var jqscript=document.createElement('script');
jqscript.onload=函数(){
//处理标签
jQuery(“#我的内容容器”).find('a[href^='http://my-old-website.com“]”)。每个(函数(i,锚点){
jQuery(anchor).attr('href',jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
//对待

注意:要保存此书签小程序代码,请右键单击浏览器的工具栏并创建一个新书签,然后输入上述代码作为位置/URL。

考虑到旧网站和新网站将具有相同的URL结构,这里有一个书签小程序,您可以将其作为书签保存到工具栏

为了简化您的工作,打开一个旧网站页面,只需单击您保存的bookmarklet按钮(下面的代码)。此代码将替换从旧网站到新网站的链接。图像将以类似方式处理。接下来,您可以复制更新的内容并将其粘贴到新网站的编辑器(wordpress admin)中

在开发者的控制台上(F12键),你会得到一个你必须下载的所有图像的列表

javascript:(function(){
    var jqscript = document.createElement('script');
    jqscript.onload = function() {
        // treat the <a> tags
        jQuery('#my-content-container').find('a[href^="http://my-old-website.com"]').each(function(i, anchor) {
            jQuery(anchor).attr('href', jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
        });
        // treat the <img> tags, and make a list of images to download
        var images_to_download = [];
        jQuery('#my-content-container').find('img').each(function(i, image) {
            images_to_download.push(jQuery(image).attr('src'));
            jQuery(image).attr('src', jQuery(image).attr('src').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
        });
        // output a list of images to the developer console
        console.log(images_to_download);
    };
    jqscript.src = "//ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js";
}());
javascript:(函数(){
var jqscript=document.createElement('script');
jqscript.onload=函数(){
//处理标签
jQuery(“#我的内容容器”).find('a[href^='http://my-old-website.com“]”)。每个(函数(i,锚点){
jQuery(anchor).attr('href',jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
//对待

另外,要保存此bookmarklet代码,请右键单击浏览器的工具栏并创建一个新书签,然后将上述代码作为位置/URL输入。

这只是您应该考虑的一个选项:您可以使用绝对路径而不是相对路径,这将帮助您重用代码,而无需重新映射其中的每个链接

Relatif路径:

<a href="/pictures/tahiti-vacation/tahiti.html">Read about my Tahiti vacation.</a>

绝对路径:

<a href="http://www.website.com/pictures/tahiti.html">Read about my Tahiti vacation.</a>

这只是您应该考虑的一个选项:您可以使用绝对路径而不是相对路径,这将帮助您重用代码,而无需重新映射其中的每个链接

Relatif路径:

<a href="/pictures/tahiti-vacation/tahiti.html">Read about my Tahiti vacation.</a>

绝对路径:

<a href="http://www.website.com/pictures/tahiti.html">Read about my Tahiti vacation.</a>


您可以简单地将所有链接设置为绝对链接,这样它就不会依赖于您所在的页面!您可以简单地将所有链接设置为绝对链接,这样它就不会依赖于您所在的页面!