Json 将URL与重命名的本地图像文件重新关联(无需重新抓取)
(*如果有人有更好的名字来描述这篇文章,请随意重命名。) 我现在正在踢自己。我从网上刮下数千张图片,然后在本地保存的同时重命名它们。我创建了一个类似以下JSON的日志Json 将URL与重命名的本地图像文件重新关联(无需重新抓取),json,windows,image,web-scraping,web-crawler,Json,Windows,Image,Web Scraping,Web Crawler,(*如果有人有更好的名字来描述这篇文章,请随意重命名。) 我现在正在踢自己。我从网上刮下数千张图片,然后在本地保存的同时重命名它们。我创建了一个类似以下JSON的日志 { "unique_id": { "images_tally": N, "posts_ids": { "unique_post_id": [ "url_to_an_image", #
{
"unique_id": {
"images_tally": N,
"posts_ids": {
"unique_post_id": [
"url_to_an_image", # unique_id (1).jpg
"url_to_an_image", # unique_id (2).jpg
"url_to_an_image" # unique_id (3).jpg
],
"unique_post_id2": [
"url_to_an_image", # unique_id (4).jpg
"url_to_an_image" # ...
],
...
}
}
"unique_id2": {
"images_tally": N,
"posts_ids": {
"unique_post_id3": [
"url_to_an_image", # unique_id2 (1).jpg
"url_to_an_image", # unique_id2 (2).jpg
"url_to_an_image" # ...
],
...
}
}
},
...
只有在我完成了所有这些图片的删除和重命名之后,我才意识到,现在没有明显的方法可以让我识别哪个URL,甚至是Post ID对应于一个特定的图片,这将非常有用
{
"unique_id": {
"images_tally": N,
"posts_ids": {
"unique_post_id": [
["unique_id (1).jpg", "url_to_an_image"],
["unique_id (2).jpg", "url_to_an_image"],
["unique_id (3).jpg", "url_to_an_image"]
],
我不相信有任何方法可以在没有图像识别的情况下找出哪个URL对应于任何给定的图像,但希望我错了
我希望原始的非本地文件名可能会存储在每个图像的元数据中的某个位置,但事实并非如此
我真的负担不起再次刮除所有内容,但唯一的两个选择似乎是要么重新刮除,要么重复检查每个图像,然后手动调整JSON
有人知道有其他可能的方法吗