用python切片mp3文件_Python_Mp3

用python切片mp3文件

python

用python切片mp3文件,python,mp3,Python,Mp3,首先，这个问题是从这个答案中推断出来的。在这个答案中，我们使用Python拆分了一个mp3文件。该代码是有用的，但用于拆分两部分。例如，如果我想将30.00秒分割到音频的末尾，这很酷，但如果我想将30.00秒分割到35.00秒，这是没有用的。下面的答案有一个关于如何修剪音频的评论，就像我说的，具体的一块。当我暗示代码说明时，它看起来是这样的： import struct import sys #MP3 frames are not independent because of the byte

首先，这个问题是从这个答案中推断出来的。在这个答案中，我们使用Python拆分了一个mp3文件。该代码是有用的，但用于拆分两部分。例如，如果我想将30.00秒分割到音频的末尾，这很酷，但如果我想将30.00秒分割到35.00秒，这是没有用的。下面的答案有一个关于如何修剪音频的评论，就像我说的，具体的一块。当我暗示代码说明时，它看起来是这样的：

import struct
import sys

#MP3 frames are not independent because of the byte reservoir. This script does not account for
#that in determining where to do the split.

def SplitMp3(fi, firstSplit_sec,secondSplit_sec, out):

    #Constants for MP3
    bitrates = {0x0: "free", 0x1: 32, 0x2: 40, 0x3: 48, 0x4: 56, 0x5: 64, 0x6: 80, 0x7: 96, 0x8: 112,
        0x9: 128, 0xa: 160, 0xb: 192, 0xc: 224, 0xd: 256, 0xe: 320, 0xf: "bad"}
    freqrates = {0x0: 44100, 0x1: 48000, 0x2: 32000, 0x3: "reserved"}
    countMpegFrames = 0
    frameDuration = 0.026
    unrecognizedBytes = 0
    firstSplitFrame = int(round(firstSplit_sec / frameDuration))
    secondSplitFrame = int(round(secondSplit_sec / frameDuration))


    while True:

        startPos = fi.tell()

        #Check for 3 byte headers
        id3Start = fi.read(3)
        if len(id3Start) == 3:

            if id3Start == b'TAG':
                #print ("Found ID3 v1/1.1 header")
                fi.seek(startPos + 256)
                continue

            if id3Start == b'ID3':
                #Possibly a ID3v2 header
                majorVer, minorVer, flags, encSize = struct.unpack(">BBBI", fi.read(7))
                if majorVer != 0xFF and minorVer != 0xFF:
                    encSize1 = (encSize & 0x7f000000) >> 24
                    encSize2 = (encSize & 0x7f0000) >> 16
                    encSize3 = (encSize & 0x7f00) >> 8
                    encSize4 = (encSize & 0x7f)
                    if encSize1 < 0x80 and encSize2 < 0x80 and encSize3 < 0x80 and encSize4 < 0x80:
                        size = ((encSize & 0x7f000000) >> 3) + ((encSize & 0x7f0000) >> 2) + ((encSize & 0x7f00) >> 1) + (encSize & 0x7f)
                        unsync = (flags >> 7) & 0x1
                        extendedHeader = (flags >> 6) & 0x1
                        experimental = (flags >> 5) & 0x1
                        #print ("Found ID3v2 header")
                        #print ("version", majorVer, minorVer, unsync, extendedHeader, experimental)
                        #print ("size", size)
                        #TODO extendedHeader not supported yet

                        fi.seek(startPos + 10 + size)
                        continue

        #Check for 4 byte headers
        fi.seek(startPos)
        headerRaw = fi.read(4)
        if len(headerRaw) == 4:
            headerWord = struct.unpack(">I", headerRaw)[0]

            #Check for MPEG-1 audio frame
            if headerWord & 0xfff00000 == 0xfff00000:
                #print ("Possible MPEG-1 audio header", hex(headerWord))
                countMpegFrames += 1
                ver = (headerWord & 0xf0000) >> 16
                bitrateEnc = (headerWord & 0xf000) >> 12
                freqEnc = (headerWord & 0xf00) >> 8
                mode = (headerWord & 0xf0) >> 4
                cpy = (headerWord & 0xf)
                if ver & 0xe == 0xa and freqEnc != 0xf:
                    #print ("Probably an MP3 frame")
                    bitrate = bitrates[bitrateEnc]
                    freq = freqrates[freqEnc >> 2]
                    padding = ((freqEnc >> 1) & 0x1) == 1
                    #print ("bitrate", bitrate, "kbps")
                    #print ("freq", freq, "Hz")
                    #print ("padding", padding)
                    frameLen = int((144 * bitrate * 1000 / freq ) + padding)

                    #Copy frame to output
                    fi.seek(startPos)
                    frameData = fi.read(frameLen)
                    if (secondSplitFrame >= countMpegFrames) and (countMpegFrames >= firstSplitFrame):
                        out.write(frameData)

                    fi.seek(startPos + frameLen)
                    continue
                else:
                    raise RuntimeError("Unsupported format:", hex(ver), "header:", hex(headerWord))

        #If no header can be detected, move on to the next byte
        fi.seek(startPos)
        nextByteRaw = fi.read(1)
        if len(nextByteRaw) == 0:
            break #End of file
        unrecognizedBytes += 1

    #print ("unrecognizedBytes", unrecognizedBytes)
    #print ("countMpegFrames", countMpegFrames)
    #print ("duration", countMpegFrames * frameDuration, "sec")

导入结构
导入系统
#MP3帧不是独立的，因为字节库。此脚本不考虑
#这是决定在哪里进行拆分的关键。
def SPLITP3（fi、第一次剥离秒、第二次剥离秒、输出）：
#MP3的常数
比特率={0x0:“空闲”，0x1:32，0x2:40，0x3:48，0x4:56，0x5:64，0x6:80，0x7:96，0x8:112，
0x9:128、0xa:160、0xb:192、0xc:224、0xd:256、0xe:320、0xf：“坏”}
频率={0x0:44100，0x1:48000，0x2:32000，0x3:“保留”}
countMpegFrames=0
帧持续时间=0.026
无法识别的字节=0
firstSplitFrame=int（四舍五入（firstSplit_秒/帧时长））
secondSplitFrame=int（四舍五入（secondSplit_秒/帧时长））
尽管如此：
startPos=fi.tell（）
#检查3字节头
id3Start=fi.read（3）
如果len（id3Start）==3：
如果id3Start==b'TAG'：
#打印（“找到ID3 v1/1.1标题”）
fi.seek（startPos+256）
持续
如果id3Start==b'ID3'：
#可能是ID3v2头
主服务器，最小服务器，标志，encSize=struct.unpack（“>BBBI”，fi.read（7））
如果是majorVer！=0xFF和minorVer！=0xFF:
encSize1=（encSize&0x7f000000）>>24
encSize2=（encSize&0x7f0000）>>16
encSize3=（encSize&0x7f00）>>8
encSize4=（encSize&0x7f）
如果encSize1<0x80，encSize2<0x80，encSize3<0x80，encSize4<0x80：
大小=（（encSize&0x7f000000）>>3）+（（encSize&0x7f0000）>>2）+（（encSize&0x7f00）>>1）+（encSize&0x7f）
不同步=（标志>>7）和0x1
extendedHeader=（标志>>6）和0x1
实验=（标志>>5）和0x1
#打印（“找到ID3v2标题”）
#打印（“版本”、主服务器、minorVer、不同步、extendedHeader、实验性）
#打印（“大小”，大小）
#尚未支持TODO extendedHeader
fi.seek（startPos+10+尺寸）
持续
#检查4字节头
fi.seek（startPos）
headerRaw=fi.read（4）
如果len（headerRaw）==4：
headerWord=struct.unpack（“>I”，headerRaw）[0]
#检查MPEG-1音频帧
如果headerWord&0xfff00000==0xfff00000：
#打印（“可能的MPEG-1音频头”，十六进制（头字））
countMpegFrames+=1
版本=（headerWord&0xf0000）>>16
比特率编码=（headerWord&0xf000）>>12
频率=（headerWord&0xf00）>>8
模式=（headerWord&0xf0）>>4
cpy=（headerWord&0xf）
如果版本&0xe==0xa且频率！=0xf:
#打印（“可能是MP3帧”）
比特率=比特率[bitrateEnc]
freq=freqrates[frequenc>>2]
填充=（（频率>>1）和0x1）==1
#打印（“比特率”，比特率，“kbps”）
#打印（“频率”，频率，赫兹”）
#打印（“填充”，填充）
frameLen=int（（144*比特率*1000/频率）+填充）
#将帧复制到输出
fi.seek（startPos）
frameData=fi.read（frameLen）
如果（secondSplitFrame>=countMpegFrames）和（countMpegFrames>=firstSplitFrame）：
out.write（帧数据）
fi.seek（startPos+frameLen）
持续
其他：
raise RUNTIMERROR（“不支持的格式：”，十六进制（版本），“页眉：”，十六进制（页眉））
#如果未检测到任何标头，请转到下一个字节
fi.seek（startPos）
nextByteRaw=fi.read（1）
如果len（nextByteRaw）==0：
断开#文件结尾
无法识别的字节数+=1
#打印（“未识别字节”，未识别字节）
#打印（“countMpegFrames”，countMpegFrames）
#打印（“持续时间”，countMpegFrames*frameDuration，秒”）

当我使用这个函数时，它会产生疯狂的输出。例如，如果我想将0.0分割到41.00，它会给我0.00到37.00，这种松弛度会随着切片量的增加而增加。我一直在努力理解代码的某些部分。所以我在问我如何才能解决这个问题？我错过什么了吗

注意：我已经尝试了pydub和类似的模块。但它们是无用的。总是给内存错误和慢。这真的很快。

我找不到解决松散问题的方法，因此我使用ffmpeg进行切片

subprocess.call(["ffmpeg","-i",input_file,"-acodec","copy","-loglevel","quiet","-ss",str(start),"-to",str(end),"-metadata","title={}".format(name),output_file+".mp3"])