Statistics 什么';web用户最不常用的字符是什么?

Statistics 什么';web用户最不常用的字符是什么?,statistics,Statistics,我需要把这个用作分隔符 有人知道这方面的统计数据吗?我肯定有很多奇怪的unicode字符没有被广泛使用,但这可能不是你想要的 为什么您想要一些“罕见”的分隔符?它将如何使用?我肯定有很多奇怪的unicode字符没有被广泛使用,但这可能不是你想要的 为什么您想要一些“罕见”的分隔符?如何使用它?使用字符串作为分隔符怎么样?使用字符串作为分隔符怎么样?选择任何字符,然后选择转义该字符的机制,以处理用户想要键入它的情况。例如,在逗号分隔的文件中,逗号是分隔符: 1,2,fred,john 1,2,弗雷

我需要把这个用作分隔符


有人知道这方面的统计数据吗?

我肯定有很多奇怪的unicode字符没有被广泛使用,但这可能不是你想要的


为什么您想要一些“罕见”的分隔符?它将如何使用?

我肯定有很多奇怪的unicode字符没有被广泛使用,但这可能不是你想要的


为什么您想要一些“罕见”的分隔符?如何使用它?

使用字符串作为分隔符怎么样?

使用字符串作为分隔符怎么样?

选择任何字符,然后选择转义该字符的机制,以处理用户想要键入它的情况。例如,在逗号分隔的文件中,逗号是分隔符:

1,2,fred,john 1,2,弗雷德,约翰 除非数据本身包含逗号,否则请引用它:

1,2,"Bloggs, Fred",john 1,2,“布洛格斯,弗雷德”,约翰 如果您需要使用报价:

1,2,"Bloggs, Fred","Jean-Luc \"Make it so\" Picard"
1,2,“Bloggs,Fred”,“Jean Luc\”使其成为“Picard”选择任何字符,然后选择一种机制来转义该字符,以处理用户想要键入的情况。例如,在逗号分隔的文件中,逗号是分隔符:

1,2,fred,john 1,2,弗雷德,约翰 除非数据本身包含逗号,否则请引用它:

1,2,"Bloggs, Fred",john 1,2,“布洛格斯,弗雷德”,约翰 如果您需要使用报价:

1,2,"Bloggs, Fred","Jean-Luc \"Make it so\" Picard"
1,2,“Bloggs,Fred”,“Jean Luc\”使其成为“Picard”我认为使用什么字符并不重要,你不应该只希望没有人会键入你的分隔符。使用逗号并处理用户添加他们自己的逗号。

我认为使用什么字符并不重要,你不应该只希望没有人键入分隔符。使用逗号并处理用户添加他们自己的逗号。

您可以在web上的任何数据前面加上长度前缀。。这就是HTTP分块编码在web上发送内容的方式


您可以在web上的任何数据前面加上长度前缀。。这就是HTTP分块编码在web上发送内容的方式


在这种情况下,我喜欢使用竖线字符

  • 查看文本文件时很容易发现
  • 它清楚地标志着分离
  • 它很少被使用
  • 而且,由于它在英语语法中没有固有的意义,如果它出现在专栏文本中,很容易就不允许它,或者盲目地将它改成其他东西(如破折号)

在这种情况下,我喜欢使用竖线字符

  • 查看文本文件时很容易发现
  • 它清楚地标志着分离
  • 它很少被使用
  • 而且,由于它在英语语法中没有固有的意义,如果它出现在专栏文本中,很容易就不允许它,或者盲目地将它改成其他东西(如破折号)

听起来你好像在试图将一个字符串列表转换为一个字符串,以便以后可以将其转换为一个字符串列表

对此,有几种传统方法,其中大部分已在本帖中提到:

  • 使用一个不寻常的字符作为分隔符,不要将其包含在输入中,或者拒绝包含分隔符的输入,或者用“?”或“.”或类似字符替换分隔符。为此,我同意建议竖线(|)的人的意见
    • 优点:代码简单,语言多样
    • 缺点:由于消除了输入中包含分隔符的可能性,您将失去一些表达能力和将来扩展的机会
  • 当分隔符出现在输入中时,请使用分隔符和转义机制。实际上,这有几个变体:
    • “就像C代码”方法,在该方法中,您可以为数据中出现的每一个分隔符或转义字符预先添加一个转义字符。例如:字符串«
      问候语,嘿,你好\,世界,你好\\反斜杠
      »包含四个元素,使用
      作为分隔符,
      \
      作为转义字符。(最后一个元素最初有一个反斜杠)
      • 在许多语言中正确地编码和实现这实际上是一件非常痛苦的事情
      • 即使您实现了它,它通常也比其他方法慢得多
    • “like URL parameters”方法,其中转义机制是将分隔符转换为不包含分隔符的多字符序列。然后还需要将分隔符的第一个字符转换为它自己的多字符序列。例如,如果您决定使用
      作为分隔符,并决定将
      表示为«
      \1
      »和
      \
      表示为«
      \2
      »,您可以将最后一个示例编写为:«
      问候语,嘿,你好\1World,你好\2反斜杠
      »
      • 这通常不太难实现。优点是,您可以在单独的步骤中完成从字符串到字符串列表的“拆分”和“取消”部分。取消跳过的过程可能有点棘手,因为您必须扫描每个字符串
    • 与CSV文件类似,在包含分隔符的项目周围加引号,引号根据某种模糊的机制转义。(例如加倍)
      • 除非您可以直接将其扔到预先存在的库中,否则请避免此操作
      • 这具有“Like C code”方法的所有缺点,并且在实现它时会出现额外的混乱状态
    • 上述方法之一,但使用多字符分隔符。这比你想象的要难;额外的字符实际上大大复杂了应该转义的逻辑
  • 在每个项目前面加上长度前缀,然后包含未更改的项目
    • 这是由HTTP在its、by(有线格式b)中使用的