减去java文本字符串

减去java文本字符串,java,split,substring,indexof,Java,Split,Substring,Indexof,我想从URL中提取引用 例如,我的URL看起来像: "https://www.amazon.es/Lenovo-YOGA-520-14IKB-Ordenador-convertible/dp/B071WBF4PZ/" 我只想得到参考部分,即B071WBF4PZ 我还想从这个html元素中提取价格: "<div id="cerberus-data-metrics" style="display: none;" data-asin="B078ZYX4R5" data-asin-price="

我想从URL中提取引用

例如,我的URL看起来像:

"https://www.amazon.es/Lenovo-YOGA-520-14IKB-Ordenador-convertible/dp/B071WBF4PZ/"
我只想得到参考部分,即B071WBF4PZ

我还想从这个html元素中提取价格:

"<div id="cerberus-data-metrics" style="display: none;" data-asin="B078ZYX4R5" data-asin-price="1479.00" data-asin-shipping="0" data-asin-currency-code="EUR" data-substitute-count="0" data-device-type="WEB" data-display-code="Asin is not eligible because it has a retail offer" ></div>"
“”
我只需要获取属性数据的值作为price

它可以通过
indexOf'、
substring
split`来完成,但我不知道怎么做。

  • 参考部分:
代码:

String url = "https://www.amazon.es/Lenovo-YOGA-520-14IKB-Ordenador-convertible/dp/B071WBF4PZ/";

String[] parts = string.split("/");
// parts : 
// [0] = "https:"
// [1] = ""
// [2] =  "www.amazon.es"
// [3] = "Lenovo-YOGA-520-14IKB-Ordenador-convertible"
// [4] = "dp"
// [5] = "B071WBF4PZ"
// [6] = ""

String reference = parts[5]; // < this is the reference.
将匹配price=“
”中数据之后的任何数字,因此匹配组1将为:
1479.00

  • 参考部分:
代码:

String url = "https://www.amazon.es/Lenovo-YOGA-520-14IKB-Ordenador-convertible/dp/B071WBF4PZ/";

String[] parts = string.split("/");
// parts : 
// [0] = "https:"
// [1] = ""
// [2] =  "www.amazon.es"
// [3] = "Lenovo-YOGA-520-14IKB-Ordenador-convertible"
// [4] = "dp"
// [5] = "B071WBF4PZ"
// [6] = ""

String reference = parts[5]; // < this is the reference.

将匹配price=“
”中
数据之后的任何数字-因此匹配组1将为:
1479.00

这两个示例完全不同:计算机如何知道如何获取所需信息?(您想要URL的最后一部分还是一些标记之间的部分,还是其他什么?)示例来自一个页面,来自URL我想要参考B071WBF4PZ的最后一部分在“/”之间,来自第二部分,仅在数据引号之间,如price=“1479.00”,价格是1479.00谢谢你解析字符串真的有问题吗,或者你的上下文是什么?例如,如果您使用Spring,则Spring会自动为您解决此解析问题。与Spring一样,您是否试图从
HTML
页面中刮取数据?这两个示例完全不同:计算机如何知道如何获取所需信息?(您想要URL的最后一部分还是一些标记之间的部分,还是其他什么?)示例来自一个页面,来自URL我想要参考B071WBF4PZ的最后一部分在“/”之间,来自第二部分,仅在数据引号之间,如price=“1479.00”,价格是1479.00谢谢你解析字符串真的有问题吗,或者你的上下文是什么?例如,如果您使用Spring,则Spring会自动为您解决此解析问题。与Spring一样,您是否试图从
HTML
页面中刮取数据?使用索引“can not count from position 17”进行解析是指价格开始时,使用索引“can not count from position 17”进行解析是指价格开始时