Validation 使用机器学习验证电话号码_Validation_Machine Learning_Scikit Learn

Validation 使用机器学习验证电话号码

validation machine-learning scikit-learn

Validation 使用机器学习验证电话号码,validation,machine-learning,scikit-learn,Validation,Machine Learning,Scikit Learn,所以我希望验证用户输入的电话号码到目前为止，我一直在使用正则表达式。但是由于来自世界各地的不同电话号码格式，维护Regex变得越来越困难因为我有很多有效电话号码的数据集，所以我认为使用机器学习算法是可能的因为我之前没有任何机器学习的经验，所以我尝试使用scikitlearn SVM对其进行原型化。它不起作用现在，如果这是机器学习算法的一个很好的用例，我会很好奇。如果是，我应该查找哪些资源？如果没有，那么除了机器学习之外，还有什么其他方法可以创建一个易于扩展的电话号码验证？这只是一个计算

所以我希望验证用户输入的电话号码

到目前为止，我一直在使用正则表达式。但是由于来自世界各地的不同电话号码格式，维护Regex变得越来越困难

因为我有很多有效电话号码的数据集，所以我认为使用机器学习算法是可能的

因为我之前没有任何机器学习的经验，所以我尝试使用scikitlearn SVM对其进行原型化。它不起作用

现在，如果这是机器学习算法的一个很好的用例，我会很好奇。如果是，我应该查找哪些资源？

如果没有，那么除了机器学习之外，还有什么其他方法可以创建一个易于扩展的电话号码验证？

这只是一个计算机编程的例子，您可能需要将代码重构成某种类，负责验证来自不同国家的电话号码

同样从正则表达式的角度来看，这里也提出了更新国际电话号码的问题：最好的答案是使用以下正则表达式：

\+(9[976]\d|8[987530]\d|6[987]\d|5[90]\d|42\d|3[875]\d|
2[98654321]\d|9[8543210]|8[6421]|6[6543210]|5[87654321]|
4[987654310]|3[9643210]|2[70]|7|1)\d{1,14}$

关于机器学习，这里有一个很好的总结，可以总结在下面的列表中：

这是A还是B

这奇怪吗

多少

它是如何组织的

接下来我该怎么办

查看博客文章（文章中还有视频）了解更多详细信息。你的问题实际上不符合上述五个类别中的任何一个

这只是一个计算机编程的例子，您可能需要将代码重构成某种类，负责验证来自不同国家的电话号码

同样从正则表达式的角度来看，这里也提出了更新国际电话号码的问题：最好的答案是使用以下正则表达式：

\+(9[976]\d|8[987530]\d|6[987]\d|5[90]\d|42\d|3[875]\d|
2[98654321]\d|9[8543210]|8[6421]|6[6543210]|5[87654321]|
4[987654310]|3[9643210]|2[70]|7|1)\d{1,14}$

关于机器学习，这里有一个很好的总结，可以总结在下面的列表中：

这是A还是B

这奇怪吗

多少

它是如何组织的

接下来我该怎么办

查看博客文章（文章中还有视频）了解更多详细信息。你的问题实际上不符合上述五个类别中的任何一个

给定的任务受语法限制+遵守管理程序机器学习需要这样一个超集训练数据集，以满足（霍夫丁不等式约束的）预测错误率，这对于低水平目标来说，目前基本上（几乎）不可能安排训练

因此，即使是正则表达式工具也（几乎）在猜测，因为E.164“地址”的终端部分（几乎）无法维护全局地址空间

概率ML学习者可能会在这里得到某种意义上的利用，但再次强调，他们甚至会有意识地猜测（通过提供每一个这样的猜测所达到的置信水平的工作估计，这是一种安慰）

为什么？因为每个电话号码（这里我们不假设词汇上的不规则和类似的修饰细节）都必须符合全球一套法规（ITU-T管辖），那么在较低的级别上，受国家一套法规（多方管辖），最后有两个不同的电话号码E.164——“地址”-作业程序，不会让故事变得简单一点

ITU-T

RFC 4725

-简要视图：只是为了实现分布式规则的层次结构，将其引入（绝对语法-分布式治理）E.164数字块分析（下至单个数字）

RFC 4725枚举验证体系结构2006年11月
中描述了E.164编号分配的这两种变体
图2：
+--------------------------------------------+
|国际电信联盟（ITU）|
+--------------------------------------------+
|
国家代码（例如+44）
|
v
+-------------------------------------------+
|国家数字计划管理员（NNPA）|------------+
+-------------------------------------------+            |
|                                    |
数字范围|
（例如，+44207946 xxxx）|
|                                    |
五|
+--------------------------------------+               |
|通信服务提供商（CSP）||
+--------------------------------------+               |
|                                    |
|单数
单个数字（例如+44 909 8790879）
或数字块（变体2）
（例如，+44 20 7946 0999，+44 20 7946 07xx）|
（备选案文1）|
|                                    |
五|
+----------+                               |
|受让人|给定任务受语法限制+受监管程序约束
机器学习需要这样一个超集训练数据集，以满足（霍夫丁不等式约束的）预测错误率，这对于低水平目标来说，目前基本上（几乎）不可能安排训练
因此，即使是正则表达式工具也（几乎）在猜测，因为E.164“地址”的终端部分（几乎）无法维护全局地址空间
概率最大似然学习者可能会