Validation 使用机器学习验证电话号码

Validation 使用机器学习验证电话号码,validation,machine-learning,scikit-learn,Validation,Machine Learning,Scikit Learn,所以我希望验证用户输入的电话号码 到目前为止,我一直在使用正则表达式。但是由于来自世界各地的不同电话号码格式,维护Regex变得越来越困难 因为我有很多有效电话号码的数据集,所以我认为使用机器学习算法是可能的 因为我之前没有任何机器学习的经验,所以我尝试使用scikitlearn SVM对其进行原型化。它不起作用 现在,如果这是机器学习算法的一个很好的用例,我会很好奇。如果是,我应该查找哪些资源? 如果没有,那么除了机器学习之外,还有什么其他方法可以创建一个易于扩展的电话号码验证?这只是一个计算

所以我希望验证用户输入的电话号码

到目前为止,我一直在使用正则表达式。但是由于来自世界各地的不同电话号码格式,维护Regex变得越来越困难

因为我有很多有效电话号码的数据集,所以我认为使用机器学习算法是可能的

因为我之前没有任何机器学习的经验,所以我尝试使用scikitlearn SVM对其进行原型化。它不起作用

现在,如果这是机器学习算法的一个很好的用例,我会很好奇。如果是,我应该查找哪些资源?
如果没有,那么除了机器学习之外,还有什么其他方法可以创建一个易于扩展的电话号码验证?

这只是一个计算机编程的例子,您可能需要将代码重构成某种类,负责验证来自不同国家的电话号码

同样从正则表达式的角度来看,这里也提出了更新国际电话号码的问题:最好的答案是使用以下正则表达式:

\+(9[976]\d|8[987530]\d|6[987]\d|5[90]\d|42\d|3[875]\d|
2[98654321]\d|9[8543210]|8[6421]|6[6543210]|5[87654321]|
4[987654310]|3[9643210]|2[70]|7|1)\d{1,14}$
关于机器学习,这里有一个很好的总结,可以总结在下面的列表中:

  • 这是A还是B
  • 这奇怪吗
  • 多少
  • 它是如何组织的
  • 接下来我该怎么办

  • 查看博客文章(文章中还有视频)了解更多详细信息。你的问题实际上不符合上述五个类别中的任何一个

    这只是一个计算机编程的例子,您可能需要将代码重构成某种类,负责验证来自不同国家的电话号码

    同样从正则表达式的角度来看,这里也提出了更新国际电话号码的问题:最好的答案是使用以下正则表达式:

    \+(9[976]\d|8[987530]\d|6[987]\d|5[90]\d|42\d|3[875]\d|
    2[98654321]\d|9[8543210]|8[6421]|6[6543210]|5[87654321]|
    4[987654310]|3[9643210]|2[70]|7|1)\d{1,14}$
    
    关于机器学习,这里有一个很好的总结,可以总结在下面的列表中:

  • 这是A还是B
  • 这奇怪吗
  • 多少
  • 它是如何组织的
  • 接下来我该怎么办
  • 查看博客文章(文章中还有视频)了解更多详细信息。你的问题实际上不符合上述五个类别中的任何一个

    给定的任务受语法限制+遵守管理程序 机器学习需要这样一个超集训练数据集,以满足(霍夫丁不等式约束的)预测错误率,这对于低水平目标来说,目前基本上(几乎)不可能安排训练

    因此,即使是正则表达式工具也(几乎)在猜测,因为E.164“地址”的终端部分(几乎)无法维护全局地址空间

    概率ML学习者可能会在这里得到某种意义上的利用,但再次强调,他们甚至会有意识地猜测(通过提供每一个这样的猜测所达到的置信水平的工作估计,这是一种安慰)

    为什么? 因为每个电话号码(这里我们不假设词汇上的不规则和类似的修饰细节)都必须符合全球一套法规(ITU-T管辖),那么在较低的级别上,受国家一套法规(多方管辖),最后有两个不同的电话号码E.164——“地址”-作业程序,不会让故事变得简单一点


    ITU-T
    RFC 4725
    -简要视图: 只是为了实现分布式规则的层次结构,将其引入(绝对语法-分布式治理)E.164数字块分析(下至单个数字)

    RFC 4725枚举验证体系结构2006年11月
    中描述了E.164编号分配的这两种变体
    图2:
    +--------------------------------------------+
    |国际电信联盟(ITU)|
    +--------------------------------------------+
    |
    国家代码(例如+44)
    |
    v
    +-------------------------------------------+
    |国家数字计划管理员(NNPA)|------------+
    +-------------------------------------------+            |
    |                                    |
    数字范围|
    (例如,+44207946 xxxx)|
    |                                    |
    五|
    +--------------------------------------+               |
    |通信服务提供商(CSP)||
    +--------------------------------------+               |
    |                                    |
    |单数
    单个数字(例如+44 909 8790879)
    或数字块(变体2)
    (例如,+44 20 7946 0999,+44 20 7946 07xx)|
    (备选案文1)|
    |                                    |
    五|
    +----------+                               |
    |受让人|给定任务受语法限制+受监管程序约束
    机器学习需要这样一个超集训练数据集,以满足(霍夫丁不等式约束的)预测错误率,这对于低水平目标来说,目前基本上(几乎)不可能安排训练

    因此,即使是正则表达式工具也(几乎)在猜测,因为E.164“地址”的终端部分(几乎)无法维护全局地址空间

    概率最大似然学习者可能会