Audio 在维护元信息的同时,建议使用哪些便携式工具和库对音频进行时间拉伸/压缩转码?

Audio 在维护元信息的同时,建议使用哪些便携式工具和库对音频进行时间拉伸/压缩转码?,audio,portability,transcode,Audio,Portability,Transcode,我希望实现一个使用尽可能多的现有工具的播客转码工具/脚本。您会推荐哪些工具和库的组合 目标: 自动将音频订阅(口语播客)转码到更小的大小(Ogg Vorbis和Speex),并使它们可以同步到多个设备(Android手机和带Rockbox的iPod) 带有节奏调整的时间压缩文件,保持音高(1.5倍至2.5倍,增量至少为0.1倍) 在转码文件中保留所有元信息(id3和图像) 最好使用小型可移植Unix/Linux工具和兼容库(也可以使用Windows上的Cygwin或Wine兼容调用) 同时解码/

我希望实现一个使用尽可能多的现有工具的播客转码工具/脚本。您会推荐哪些工具和库的组合

目标:

  • 自动将音频订阅(口语播客)转码到更小的大小(Ogg Vorbis和Speex),并使它们可以同步到多个设备(Android手机和带Rockbox的iPod)
  • 带有节奏调整的时间压缩文件,保持音高(1.5倍至2.5倍,增量至少为0.1倍)
  • 在转码文件中保留所有元信息(id3和图像)
  • 最好使用小型可移植Unix/Linux工具和兼容库(也可以使用Windows上的Cygwin或Wine兼容调用)
  • 同时解码/编码和时间紧缩在一次通过将是一个奖金,以节省计算时间

  • SoX没有Speex支持。MPlayer以-speed作为参数,可以对WAV进行解码和速度调整,然后是ogg/speex标准编码器,最后是id3tool或其他一些元信息处理工具。是否有其他符合要求的替代转码管道?

    如果您发现需要开始编写程序,一些好的起点是:

    • 用于格式转换和访问属性
    • 用于时间压缩/扩展
    • 并可能为您的输入提供采样率转换器

    您的问题的一个问题是,它的输入格式和文件属性似乎没有绑定。例如,某些格式能够定义区域-您应该如何处理这种情况?省略那个信息?保持原样(即使拉伸后不正确)?根据比例因子调整区域?最后一个是最好的,但是如果需要支持的话,你可能需要用C或C++来弄脏你的手。

    < P>如果你发现你需要下注到程序,一些好的开始点是:

    • 用于格式转换和访问属性
    • 用于时间压缩/扩展
    • 并可能为您的输入提供采样率转换器

    您的问题的一个问题是,它的输入格式和文件属性似乎没有绑定。例如,某些格式能够定义区域-您应该如何处理这种情况?省略那个信息?保持原样(即使拉伸后不正确)?根据比例因子调整区域?最后一个是最好的,但是如果需要支持的话,你可能需要用C或C++来弄脏你的手。

    注意你的3个标签中有2个跟随者的低阶。Linux标签可能会让你获得更多的浏览者。或者,您可能想重新考虑对*ix解决方案的绝对依赖性。Windows上可能有更多可用的工具。最后,这仅仅通过了一个编程问题的测试,这是S.O.的重点。但是你良好的格式和清楚的迹象表明你做了一些研究,从我这里为你赢得了+1。考虑标记已由版主移动到SuffuServer。祝你好运。谢谢你的意见,谢勒。Justin已经指出了一些编程库,这是我期待的答案。也是图书馆考虑的问题。我很熟悉C/C++在这些库中的混合。起初我不愿意把问题放在这里,超级用户、unix或avp。考虑到Linux标签,这似乎是一个很好的建议,我会接受它,谢谢。Windows库和工具也很好,只要它们最终能够移植到其他平台。请注意,3个标签中的2个标签上的追随者数量较低。Linux标签可能会让你获得更多的浏览者。或者,您可能想重新考虑对*ix解决方案的绝对依赖性。Windows上可能有更多可用的工具。最后,这仅仅通过了一个编程问题的测试,这是S.O.的重点。但是你良好的格式和清楚的迹象表明你做了一些研究,从我这里为你赢得了+1。考虑标记已由版主移动到SuffuServer。祝你好运。谢谢你的意见,谢勒。Justin已经指出了一些编程库,这是我期待的答案。也是图书馆考虑的问题。我很熟悉C/C++在这些库中的混合。起初我不愿意把问题放在这里,超级用户、unix或avp。考虑到Linux标签,这似乎是一个很好的建议,我会接受它,谢谢。Windows库和工具也很好,只要它们最终能够移植到其他平台。