Wordpress 从网页中获取所有链接和图像的最快方法?
因此,这不是一个真正的问题,更像是自动完成任务……Wordpress 从网页中获取所有链接和图像的最快方法?,wordpress,web-scraping,Wordpress,Web Scraping,因此,这不是一个真正的问题,更像是自动完成任务…… 我建立了一个网站,不得不从以前的网页上复制大量内容。我是通过将旧页面的内容复制粘贴到wordpress制作的新页面来实现的 内容中的所有链接和图像仍然指向旧页面。所以我想找到一个类似webscraping的工具,它可以分析所选链接的列表,然后输出指向我的网页之外的所有链接,以及我必须下载的所有图像的列表,考虑到你的新旧网站将具有相同的URL结构,这是一个书签,您可以将其另存为工具栏上的书签 为了让你的工作更简单,打开一个旧的网站页面,只需点击你
我建立了一个网站,不得不从以前的网页上复制大量内容。我是通过将旧页面的内容复制粘贴到wordpress制作的新页面来实现的
内容中的所有链接和图像仍然指向旧页面。所以我想找到一个类似webscraping的工具,它可以分析所选链接的列表,然后输出指向我的网页之外的所有链接,以及我必须下载的所有图像的列表,考虑到你的新旧网站将具有相同的URL结构,这是一个书签,您可以将其另存为工具栏上的书签 为了让你的工作更简单,打开一个旧的网站页面,只需点击你保存的bookmarklet按钮(代码如下)。此代码将替换从旧网站到新网站的链接。图像将以类似方式处理。接下来,您可以复制更新的内容并将其粘贴到新网站的编辑器(wordpress admin)中 在开发者的控制台上(F12键),你会得到一个你必须下载的所有图像的列表
javascript:(function(){
var jqscript = document.createElement('script');
jqscript.onload = function() {
// treat the <a> tags
jQuery('#my-content-container').find('a[href^="http://my-old-website.com"]').each(function(i, anchor) {
jQuery(anchor).attr('href', jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
// treat the <img> tags, and make a list of images to download
var images_to_download = [];
jQuery('#my-content-container').find('img').each(function(i, image) {
images_to_download.push(jQuery(image).attr('src'));
jQuery(image).attr('src', jQuery(image).attr('src').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
// output a list of images to the developer console
console.log(images_to_download);
};
jqscript.src = "//ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js";
}());
javascript:(函数(){
var jqscript=document.createElement('script');
jqscript.onload=函数(){
//处理标签
jQuery(“#我的内容容器”).find('a[href^='http://my-old-website.com“]”)。每个(函数(i,锚点){
jQuery(anchor).attr('href',jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
//对待
注意:要保存此书签小程序代码,请右键单击浏览器的工具栏并创建一个新书签,然后输入上述代码作为位置/URL。考虑到旧网站和新网站将具有相同的URL结构,这里有一个书签小程序,您可以将其作为书签保存到工具栏
为了简化您的工作,打开一个旧网站页面,只需单击您保存的bookmarklet按钮(下面的代码)。此代码将替换从旧网站到新网站的链接。图像将以类似方式处理。接下来,您可以复制更新的内容并将其粘贴到新网站的编辑器(wordpress admin)中
在开发者的控制台上(F12键),你会得到一个你必须下载的所有图像的列表
javascript:(function(){
var jqscript = document.createElement('script');
jqscript.onload = function() {
// treat the <a> tags
jQuery('#my-content-container').find('a[href^="http://my-old-website.com"]').each(function(i, anchor) {
jQuery(anchor).attr('href', jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
// treat the <img> tags, and make a list of images to download
var images_to_download = [];
jQuery('#my-content-container').find('img').each(function(i, image) {
images_to_download.push(jQuery(image).attr('src'));
jQuery(image).attr('src', jQuery(image).attr('src').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
// output a list of images to the developer console
console.log(images_to_download);
};
jqscript.src = "//ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js";
}());
javascript:(函数(){
var jqscript=document.createElement('script');
jqscript.onload=函数(){
//处理标签
jQuery(“#我的内容容器”).find('a[href^='http://my-old-website.com“]”)。每个(函数(i,锚点){
jQuery(anchor).attr('href',jQuery(anchor).attr('href').replace('http://my-old-website.com', 'http://my-new-website.com/new-directory'));
});
//对待
另外,要保存此bookmarklet代码,请右键单击浏览器的工具栏并创建一个新书签,然后将上述代码作为位置/URL输入。这只是您应该考虑的一个选项:您可以使用绝对路径而不是相对路径,这将帮助您重用代码,而无需重新映射其中的每个链接
Relatif路径:
<a href="/pictures/tahiti-vacation/tahiti.html">Read about my Tahiti vacation.</a>
绝对路径:
<a href="http://www.website.com/pictures/tahiti.html">Read about my Tahiti vacation.</a>
这只是您应该考虑的一个选项:您可以使用绝对路径而不是相对路径,这将帮助您重用代码,而无需重新映射其中的每个链接
Relatif路径:
<a href="/pictures/tahiti-vacation/tahiti.html">Read about my Tahiti vacation.</a>
绝对路径:
<a href="http://www.website.com/pictures/tahiti.html">Read about my Tahiti vacation.</a>
您可以简单地将所有链接设置为绝对链接,这样它就不会依赖于您所在的页面!您可以简单地将所有链接设置为绝对链接,这样它就不会依赖于您所在的页面!