Validation 使用机器学习验证电话号码
所以我希望验证用户输入的电话号码 到目前为止,我一直在使用正则表达式。但是由于来自世界各地的不同电话号码格式,维护Regex变得越来越困难 因为我有很多有效电话号码的数据集,所以我认为使用机器学习算法是可能的 因为我之前没有任何机器学习的经验,所以我尝试使用scikitlearn SVM对其进行原型化。它不起作用 现在,如果这是机器学习算法的一个很好的用例,我会很好奇。如果是,我应该查找哪些资源?Validation 使用机器学习验证电话号码,validation,machine-learning,scikit-learn,Validation,Machine Learning,Scikit Learn,所以我希望验证用户输入的电话号码 到目前为止,我一直在使用正则表达式。但是由于来自世界各地的不同电话号码格式,维护Regex变得越来越困难 因为我有很多有效电话号码的数据集,所以我认为使用机器学习算法是可能的 因为我之前没有任何机器学习的经验,所以我尝试使用scikitlearn SVM对其进行原型化。它不起作用 现在,如果这是机器学习算法的一个很好的用例,我会很好奇。如果是,我应该查找哪些资源? 如果没有,那么除了机器学习之外,还有什么其他方法可以创建一个易于扩展的电话号码验证?这只是一个计算
如果没有,那么除了机器学习之外,还有什么其他方法可以创建一个易于扩展的电话号码验证?这只是一个计算机编程的例子,您可能需要将代码重构成某种类,负责验证来自不同国家的电话号码 同样从正则表达式的角度来看,这里也提出了更新国际电话号码的问题:最好的答案是使用以下正则表达式:
\+(9[976]\d|8[987530]\d|6[987]\d|5[90]\d|42\d|3[875]\d|
2[98654321]\d|9[8543210]|8[6421]|6[6543210]|5[87654321]|
4[987654310]|3[9643210]|2[70]|7|1)\d{1,14}$
关于机器学习,这里有一个很好的总结,可以总结在下面的列表中:
查看博客文章(文章中还有视频)了解更多详细信息。你的问题实际上不符合上述五个类别中的任何一个 这只是一个计算机编程的例子,您可能需要将代码重构成某种类,负责验证来自不同国家的电话号码 同样从正则表达式的角度来看,这里也提出了更新国际电话号码的问题:最好的答案是使用以下正则表达式:
\+(9[976]\d|8[987530]\d|6[987]\d|5[90]\d|42\d|3[875]\d|
2[98654321]\d|9[8543210]|8[6421]|6[6543210]|5[87654321]|
4[987654310]|3[9643210]|2[70]|7|1)\d{1,14}$
关于机器学习,这里有一个很好的总结,可以总结在下面的列表中:
ITU-T
RFC 4725
-简要视图:
只是为了实现分布式规则的层次结构,将其引入(绝对语法-分布式治理)E.164数字块分析(下至单个数字)
RFC 4725枚举验证体系结构2006年11月
中描述了E.164编号分配的这两种变体
图2:
+--------------------------------------------+
|国际电信联盟(ITU)|
+--------------------------------------------+
|
国家代码(例如+44)
|
v
+-------------------------------------------+
|国家数字计划管理员(NNPA)|------------+
+-------------------------------------------+ |
| |
数字范围|
(例如,+44207946 xxxx)|
| |
五|
+--------------------------------------+ |
|通信服务提供商(CSP)||
+--------------------------------------+ |
| |
|单数
单个数字(例如+44 909 8790879)
或数字块(变体2)
(例如,+44 20 7946 0999,+44 20 7946 07xx)|
(备选案文1)|
| |
五|
+----------+ |
|受让人|给定任务受语法限制+受监管程序约束
机器学习需要这样一个超集训练数据集,以满足(霍夫丁不等式约束的)预测错误率,这对于低水平目标来说,目前基本上(几乎)不可能安排训练
因此,即使是正则表达式工具也(几乎)在猜测,因为E.164“地址”的终端部分(几乎)无法维护全局地址空间
概率最大似然学习者可能会