Java 检测仅与声音文件的特定部分相关的样本数据

Java 检测仅与声音文件的特定部分相关的样本数据,java,audio,fft,wav,Java,Audio,Fft,Wav,我想提取与声音片段某个区域相关的样本字节数据,比如声音片段中的一个单词,这样我就可以得到一组样本数据,这些数据只与特定单词相关,然后我可以通过FFT发送。我将如何从整个声音文件中的字节集合中识别此数据集合?文件中的一些字节数据在转换为2字节值后看起来像这样,因为它是一个16位声音文件(44100Hz 15秒) 我知道这些数据是在时域中,我没有看到数据中有任何显著的变化,比如收集0来识别沉默。我是否能够在时域内这样做,或者我必须将这些数据带到频域,然后过滤不必要的数据,并进行反向FFT,以获得有意

我想提取与声音片段某个区域相关的样本字节数据,比如声音片段中的一个单词,这样我就可以得到一组样本数据,这些数据只与特定单词相关,然后我可以通过FFT发送。我将如何从整个声音文件中的字节集合中识别此数据集合?文件中的一些字节数据在转换为2字节值后看起来像这样,因为它是一个16位声音文件(44100Hz 15秒)


我知道这些数据是在时域中,我没有看到数据中有任何显著的变化,比如收集0来识别沉默。我是否能够在时域内这样做,或者我必须将这些数据带到频域,然后过滤不必要的数据,并进行反向FFT,以获得有意义的数据集合。提前谢谢

一种可能是最简单的方法是将声音文件加载到音频编辑应用程序中,该应用程序允许您设置选择的起点和终点,只需聆听并移动选择点,直到听到您想要的声音。试图找到软件算法可用的那些端点的准确而可靠的描述是一个困难得多的问题。

谢谢。但这是一个学术作业。甚至不可能识别出最有可能发出声音的部分。我将只能提取那几个样本值。
49150.0
43010.0
15622.0
58886.0
19460.0
35583.0
0.0
7930.0
507.0
2303.0
59897.0
39419.0
517.0
6663.0
9989.0
13055.0
9210.0