将URL安全文件名的PHP脚本转换为JavaScript?
我正在开发一个一次性转换工具,将成千上万的用户文件从一个托管环境迁移到另一个托管环境。作为迁移的一部分,我正在清理文件名,以使其URL安全。我的PHP脚本做到了这一点(不能说它是最优雅、最正确或最优化的代码,但它做到了我需要的)。文件扩展名是单独处理的,因此它们在这里不是问题将URL安全文件名的PHP脚本转换为JavaScript?,php,javascript,Php,Javascript,我正在开发一个一次性转换工具,将成千上万的用户文件从一个托管环境迁移到另一个托管环境。作为迁移的一部分,我正在清理文件名,以使其URL安全。我的PHP脚本做到了这一点(不能说它是最优雅、最正确或最优化的代码,但它做到了我需要的)。文件扩展名是单独处理的,因此它们在这里不是问题 <?php $fileName = $_POST['name']; $swap_chars = array('%20'=>'-', '&'=>'and', '@'=>'at', '='=&g
<?php
$fileName = $_POST['name'];
$swap_chars = array('%20'=>'-', '&'=>'and', '@'=>'at', '='=>'eq', '#'=>'num', '%'=>'pct', '+'=>'-', ' '=>'-', ','=>'-', '/'=>'-', ':'=>'-', ';'=>'-', '\\'=>'-', '|'=>'-', '~'=>'-', 'Š'=>'S', 'š'=>'s', 'Ð'=>'Dj', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'ss', 'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ü'=>'u', '†'=>'t', '°'=>'deg', '¢'=>'c', '£'=>'L', '§'=>'S', '•'=>'o', '¶'=>'P', '®'=>'R', '©'=>'C', '™'=>'TM', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f');
$fileName = str_replace('\\\'', '', $fileName); // strip escaped apostrophes
$fileName = str_replace('\\"', '', $fileName); // strip escaped quotes
$fileName = strtr($fileName, $swap_chars); // swap special characters
$fileName = preg_replace("/[^0-9a-zA-Z._-]/","",$fileName); // strip remaining bad characters
$fileName = preg_replace("/--+/","-",$fileName); // trim repeating dashes
$fileName = preg_replace("/\.\.+/",".",$fileName); // trim repeating periods
$fileName = preg_replace("/__+/","_",$fileName); // trim repeating underscores
$fileName = trim($fileName, '.-_'); // remove leading or trailing punctuation
$fileName = substr($fileName, 0, 62); // truncate long filenames
echo $fileName;
?>
替换Javasript中的
trim
和strtr
函数应该不会太难;以下是一些我认为几乎符合要求的功能:
function strtr(str, swapChars) {
var ret = '';
for (var i = 0; i < str.length; i++) {
ret += swapChars[str[i]] || str[i];
}
return ret;
}
function trim(str, chars) {
var lowerIndex = 0;
for (var i = 0; i < str.length; i++) {
if (chars.indexOf(str[i]) === -1) {
lowerIndex = i;
break;
}
}
for (var i = str.length - 1; i > -1; i--) {
if (chars.indexOf(str[i]) === -1) {
return str.substring(lowerIndex,i+1);
}
}
return '';
}
需要注意的是,上面实现的
strtr
仅适用于单个字符,因此不会捕获“%20”替换。如果您只有一个或两个多字符替换,那么我个人只需对这些多字符进行普通替换,然后运行strtr,否则您可以重写strtr函数以迭代一系列替换,而不是逐字符进行替换。在PHP中,有urlencode
,而在JS中有encodeURI
和encodeURIComponent
。这些可能是你需要的……谢谢@lonesomeday。我的目标是拥有简化的、人类可读的文件名,而不必进行编码。我认为文件名中的编码字符会增加用户手动输入名称(即手动编码)时出错的可能性。我想不起上一次我手动输入的URL超出了域名或可能是顶级目录名的范围。大多数URL都是点击链接,当然,除了用手输入的方式,几个单词不会有太多的效果。如果你能坚持用正则表达式来做任何事情,你可以用任何语言来使用它们,不管是JavaScript、PHP、C++还是Ruby…这些工作都很好,谢谢!刚刚将它们合并到我的迁移工具和测试中。您的警告是指“微调”功能还是“strtr”(或两者兼有)?我最终使用了“%20”的普通替换,这很好。如前所述,它们一次只比较一个字符,但我实际上是想在strtr
中强调这个缺点(现在编辑了我的打字)。
function strtr(str, swapChars) {
var ret = '';
for (var i = 0; i < str.length; i++) {
ret += swapChars[str[i]] || str[i];
}
return ret;
}
function trim(str, chars) {
var lowerIndex = 0;
for (var i = 0; i < str.length; i++) {
if (chars.indexOf(str[i]) === -1) {
lowerIndex = i;
break;
}
}
for (var i = str.length - 1; i > -1; i--) {
if (chars.indexOf(str[i]) === -1) {
return str.substring(lowerIndex,i+1);
}
}
return '';
}
alert(trim('edcbabcde', 'cde'])); // 'bab'
alert(strtr('edcbabcde', {'e': 'E', 'd': 'D', 'c': 'C'})); // 'EDCbabCDE'