ViewVC Help
View File | Revision Log | View Changeset | Root Listing
root/Oni2/OniSplit/Sound/WavExporter.cs
(Generate patch)

Comparing OniSplit/Sound/WavExporter.cs (file contents):
Revision 1114 by iritscen, Wed Jan 22 14:08:57 2020 UTC vs.
Revision 1156 by geyser, Sat May 8 01:44:24 2021 UTC

# Line 6 | Line 6 | namespace Oni.Sound
6      internal class WavExporter : SoundExporter
7      {
8          #region Private data
9 +        private bool convert_to_PCM;
10 +        private bool do_pc_demo_test;
11 +
12          private const int fcc_RIFF = 0x46464952;
13          private const int fcc_WAVE = 0x45564157;
14          private const int fcc_fmt = 0x20746d66;
15 +        private const int fcc_fact = 0x74636166;
16          private const int fcc_data = 0x61746164;
17  
18 <        private static readonly byte[] formatTemplate = new byte[50]
18 >        private static readonly byte[] formatTemplate_ADPCM = new byte[50]
19 >        {
20 >            0x02, 0,    // format ID (2 for ADPCM)
21 >            0, 0,       // ChannelCount (overwritten)
22 >            0x22, 0x56, 0, 0, // SampleRate (usually 22050, can be 44100)
23 >            0, 0, 0, 0, // average data rate (computed and overwritten)
24 >            0, 0x02,    // block alignment (default 512, can be 1024)
25 >            0x04, 0,    // bits per sample (always 4)
26 >            0x20, 0,    // size of extended ADPCM header block
27 >            0xf4, 0x03, // samples per block (usually 1012, can be 2036)
28 >            0x07, 0,    // standard ADPCM coefficient table (always the same)
29 >            0, 0x01, 0, 0,
30 >            0, 0x02, 0, 0xff,
31 >            0, 0, 0, 0,
32 >            0xc0, 0, 0x40, 0,
33 >            0xf0, 0, 0, 0,
34 >            0xcc, 0x01, 0x30, 0xff,
35 >            0x88, 0x01, 0x18, 0xff
36 >        };
37 >
38 >        private static readonly byte[] formatTemplate_PCM = new byte[16]
39          {
40 <            0x02, 0, 0, 0, 0x22, 0x56, 0, 0, 0, 0, 0, 0, 0, 0x02, 0x04, 0,
41 <            0x20, 0, 0xf4, 0x03, 0x07, 0, 0, 0x01, 0, 0, 0, 0x02, 0, 0xff, 0, 0, 0, 0, 0xc0, 0, 0x40, 0,
42 <            0xf0, 0, 0, 0, 0xcc, 0x01, 0x30, 0xff, 0x88, 0x01, 0x18, 0xff
40 >            0x01, 0,    // format ID (1 for linear PCM)
41 >            0, 0,       // ChannelCount (overwritten)
42 >            0x22, 0x56, 0, 0, // SampleRate (usually 22050, can be 44100)
43 >            0, 0, 0, 0, // data rate in bytes/s (computed and overwritten)
44 >            0x02, 0,    // block size (2 bytes for mono, 4 for stereo)
45 >            0x10, 0     // bits per sample (always 16)
46          };
47  
48 +        private static readonly byte[] factTemplate = new byte[4]
49 +        {
50 +            0, 0, 0, 0  // sample count (computed and overwritten)
51 +        };
52 +
53 +        private static readonly int[] ima_index_table = new int[16]
54 +        {
55 +           -1, -1, -1, -1, 2, 4, 6, 8,
56 +           -1, -1, -1, -1, 2, 4, 6, 8
57 +        };
58 +
59 +        private static readonly int[] ima_step_table = new int[89]
60 +        {
61 +            7, 8, 9, 10, 11, 12, 13, 14, 16, 17,
62 +            19, 21, 23, 25, 28, 31, 34, 37, 41, 45,
63 +            50, 55, 60, 66, 73, 80, 88, 97, 107, 118,
64 +            130, 143, 157, 173, 190, 209, 230, 253, 279, 307,
65 +            337, 371, 408, 449, 494, 544, 598, 658, 724, 796,
66 +            876, 963, 1060, 1166, 1282, 1411, 1552, 1707, 1878, 2066,
67 +            2272, 2499, 2749, 3024, 3327, 3660, 4026, 4428, 4871, 5358,
68 +            5894, 6484, 7132, 7845, 8630, 9493, 10442, 11487, 12635, 13899,
69 +            15289, 16818, 18500, 20350, 22385, 24623, 27086, 29794, 32767
70 +        };
71 +
72 +        private static readonly int[] msadpcm_adapt_table = new int[16]
73 +        {
74 +            230, 230, 230, 230, 307, 409, 512, 614,
75 +            768, 614, 512, 409, 307, 230, 230, 230
76 +        };
77 +
78 +        private static readonly int[] msadpcm_coeff_table1 = new int[7]
79 +        {
80 +            256, 512, 0, 192, 240, 460, 392
81 +        };
82 +
83 +        private static readonly int[] msadpcm_coeff_table2 = new int[7]
84 +        {
85 +            0, -256, 0, 64, 0, -208, -232
86 +        };
87          #endregion
88  
89 <        public WavExporter(InstanceFileManager fileManager, string outputDirPath)
89 >        public WavExporter(InstanceFileManager fileManager, string outputDirPath, bool convertToPCM = false, bool noDemo = false)
90              : base(fileManager, outputDirPath)
91          {
92 +            convert_to_PCM = convertToPCM;
93 +            do_pc_demo_test = !noDemo;
94 +        }
95 +
96 +        private static void ClampToRange(ref int value, int lower, int upper)
97 +        {
98 +            if (value > upper)
99 +                value = upper;
100 +            if (value < lower)
101 +                value = lower;
102 +        }
103 +
104 +        protected Int16 NibbletoSampleIMA4(ref int predictor, ref int step_index, Byte nibble)
105 +        {
106 +            int step = ima_step_table[step_index];
107 +
108 +            step_index += ima_index_table[nibble];
109 +            ClampToRange(ref step_index, 0, 88);
110 +
111 +            int diff = step >> 3;
112 +
113 +            if ((nibble & 0x04) != 0) diff +=  step;
114 +            if ((nibble & 0x02) != 0) diff += (step >> 1);
115 +            if ((nibble & 0x01) != 0) diff += (step >> 2);
116 +            if ((nibble & 0x08) != 0)
117 +                predictor -= diff;
118 +            else
119 +                predictor += diff;
120 +
121 +            ClampToRange(ref predictor, -32768, 32767);
122 +            return (Int16)predictor;
123 +        }
124 +
125 +        protected Int16 NibbletoSampleMSADPCM(ref Int16 sample1, ref Int16 sample2, ref UInt16 delta, Byte pred_index, Byte nibble)
126 +        {
127 +            int coeff1 = msadpcm_coeff_table1[pred_index];
128 +            int coeff2 = msadpcm_coeff_table2[pred_index];
129 +
130 +            int prediction = ((int)sample1 * (int)coeff1 + (int)sample2 * (int)coeff2) >> 8;
131 +
132 +            int snibble = (nibble < 8) ? nibble : (nibble - 16);
133 +            int correction = snibble * (int)delta;
134 +
135 +            int sample = prediction + correction;
136 +            ClampToRange(ref sample, -32768, 32767);
137 +
138 +            sample2 = sample1;
139 +            sample1 = (Int16)sample;
140 +
141 +            int newDelta = delta * msadpcm_adapt_table[nibble];
142 +            newDelta >>= 8;
143 +            ClampToRange(ref newDelta, 16, 65535);
144 +            delta = (UInt16)newDelta;
145 +
146 +            return (Int16)sample;
147          }
148  
149          protected override void ExportInstance(InstanceDescriptor descriptor)
150          {
151 <            var sound = SoundData.Read(descriptor);
151 >            var sound = SoundData.Read(descriptor, do_pc_demo_test);
152  
153              using (var stream = File.Create(Path.Combine(OutputDirPath, descriptor.FullName + ".wav")))
154              using (var writer = new BinaryWriter(stream))
155              {
156 <                var format = (byte[])formatTemplate.Clone();
157 <
158 <                Array.Copy(BitConverter.GetBytes(sound.ChannelCount), 0, format, 2, 2);
159 <                Array.Copy(BitConverter.GetBytes(sound.ChannelCount == 1 ? 11155 : 22311), 0, format, 8, 4);
160 <                Array.Copy(BitConverter.GetBytes(sound.ChannelCount == 1 ? 512 : 1024), 0, format, 12, 2);
161 <
162 <                writer.Write(fcc_RIFF);
163 <                writer.Write(8 + format.Length + 8 + sound.Data.Length);
164 <                writer.Write(fcc_WAVE);
165 <
166 <                //
167 <                // write format chunk
168 <                //
169 <
170 <                writer.Write(fcc_fmt);
171 <                writer.Write(format.Length);
172 <                writer.Write(format);
173 <
174 <                //
175 <                // write data chunk
176 <                //
177 <
178 <                writer.Write(fcc_data);
179 <                writer.Write(sound.Data.Length);
180 <                writer.Write(sound.Data);
156 >                int blockSizeADPCM, samplesPerBlock, sampleCount, paddingBytes = 0;
157 >                if (sound.IsIMA4) // IMA4 ADPCM format
158 >                {
159 >                    blockSizeADPCM = 34 * sound.ChannelCount;
160 >                    samplesPerBlock = 64;
161 >                    sampleCount = (sound.Data.Length / blockSizeADPCM) * samplesPerBlock;
162 >                }
163 >                else
164 >                {
165 >                    blockSizeADPCM = sound.BlockAlignment;
166 >                    int wholeBlocks = sound.Data.Length / blockSizeADPCM;
167 >                    int leftoverBytes = sound.Data.Length - (wholeBlocks * blockSizeADPCM);
168 >                    int leftoverSamples = 0;
169 >                    if (leftoverBytes > 7 * sound.ChannelCount)
170 >                        leftoverSamples = 2 + (leftoverBytes - 7 * sound.ChannelCount)
171 >                                        * 8 / sound.BitsPerSample / sound.ChannelCount;
172 >                    else
173 >                        Console.Error.WriteLine("Improper trailing bytes/samples!");
174 >                    if (leftoverBytes > 0) // incomplete trailing block
175 >                        paddingBytes = blockSizeADPCM - leftoverBytes;
176 >                    samplesPerBlock = 2 + (blockSizeADPCM - sound.ChannelCount * 7) * 8 / sound.ChannelCount / sound.BitsPerSample;
177 >                    sampleCount = wholeBlocks * samplesPerBlock + leftoverSamples;
178 >                }
179 >                if (!convert_to_PCM)
180 >                {
181 >                    if (sound.IsIMA4)
182 >                    {
183 >                        throw new NotSupportedException("Transcoding from IMA4 ADPCM (Mac) to MS ADPCM (PC) not supported! Please use -extract:pcm");
184 >                    }
185 >                    var format = (byte[])formatTemplate_ADPCM.Clone();
186 >                    var fact = (byte[])factTemplate.Clone(); // needed for ADPCM (to specify the actual sample count)
187 >
188 >                    var averageRate = sound.SampleRate * blockSizeADPCM / samplesPerBlock;
189 >                    Array.Copy(BitConverter.GetBytes(sound.ChannelCount), 0, format, 2, 2);
190 >                    Array.Copy(BitConverter.GetBytes(sound.SampleRate), 0, format, 4, 4);
191 >                    Array.Copy(BitConverter.GetBytes(averageRate), 0, format, 8, 4);
192 >                    Array.Copy(BitConverter.GetBytes(blockSizeADPCM), 0, format, 12, 2);
193 >                    Array.Copy(BitConverter.GetBytes(samplesPerBlock), 0, format, 18, 2);
194 >
195 >                    Array.Copy(BitConverter.GetBytes(sampleCount), 0, fact, 0, 4);
196 >
197 >                    writer.Write(fcc_RIFF);
198 >                    writer.Write(8 + format.Length + 8 + fact.Length + 8 + sound.Data.Length + paddingBytes);
199 >                    writer.Write(fcc_WAVE);
200 >
201 >                    //
202 >                    // write format chunk
203 >                    //
204 >                    writer.Write(fcc_fmt);
205 >                    writer.Write(format.Length);
206 >                    writer.Write(format);
207 >
208 >                    //
209 >                    // write fact chunk
210 >                    //
211 >                    writer.Write(fcc_fact);
212 >                    writer.Write(fact.Length);
213 >                    writer.Write(fact);
214 >
215 >                    //
216 >                    // write data chunk
217 >                    //
218 >                    writer.Write(fcc_data);
219 >                    writer.Write(sound.Data.Length + paddingBytes);
220 >                    writer.Write(sound.Data);
221 >
222 >                    Byte c = 0;
223 >                    for (int i = 0; i < paddingBytes; i++)
224 >                        writer.Write(c);
225 >                }
226 >                else
227 >                {
228 >                    var format = (byte[])formatTemplate_PCM.Clone();
229 >
230 >                    var blockSizePCM = 2 * sound.ChannelCount; // 16-bit samples or sample pairs
231 >                    samplesPerBlock = 2;
232 >                    var averageRate = sound.SampleRate * blockSizePCM / samplesPerBlock;
233 >                    Array.Copy(BitConverter.GetBytes(sound.ChannelCount), 0, format, 2, 2);
234 >                    Array.Copy(BitConverter.GetBytes(sound.SampleRate), 0, format, 4, 4);
235 >                    Array.Copy(BitConverter.GetBytes(averageRate), 0, format, 8, 4);
236 >                    Array.Copy(BitConverter.GetBytes(blockSizePCM), 0, format, 12, 2);
237 >
238 >                    int dataSize = blockSizePCM * sampleCount;
239 >
240 >                    writer.Write(fcc_RIFF);
241 >                    writer.Write(8 + format.Length + 8 + dataSize);
242 >                    writer.Write(fcc_WAVE);
243 >
244 >                    //
245 >                    // write format chunk
246 >                    //
247 >
248 >                    writer.Write(fcc_fmt);
249 >                    writer.Write(format.Length);
250 >                    writer.Write(format);
251 >
252 >                    //
253 >                    // write data chunk
254 >                    //
255 >                    var samplesL = new Int16[sampleCount];
256 >                    var samplesR = new Int16[sampleCount];
257 >                    if (sound.IsIMA4) // decode IMA4 into linear signed 16-bit PCM
258 >                    {
259 >                        int pos = 0;
260 >
261 >                        int iSampleL = 0;
262 >                        int predictorL = 0;
263 >                        int stepIndexL = 0;
264 >                        int iSampleR = 0;
265 >                        int predictorR = 0;
266 >                        int stepIndexR = 0;
267 >
268 >                        int nBlocks = sound.Data.Length / blockSizeADPCM;
269 >                        for (int block = 0; block < nBlocks; block++)
270 >                        {
271 >                            byte headerHiL = sound.Data[pos++];
272 >                            byte headerLoL = sound.Data[pos++];
273 >                            if (block == 0) // non-standard decoding: predictor initialization ignored after start
274 >                            {
275 >                                predictorL = ((((headerHiL << 1) | (headerLoL >> 7))) << 7);
276 >                                if (predictorL > 32767) predictorL -= 65536;
277 >                            }
278 >                            stepIndexL = headerLoL & 0x7f;
279 >                            if (stepIndexL > 88)
280 >                                Console.WriteLine("Block {0} (L): Initial IMA4 step index is {1}, clamping to 88.", block, stepIndexL);
281 >                            ClampToRange(ref stepIndexL, 0, 88);
282 >
283 >                            for (int b = 0; b < 32; b++)
284 >                            {
285 >                                Byte nibblesL = sound.Data[pos++];
286 >                                Byte nibbleHiL = (Byte)(nibblesL >> 4);
287 >                                Byte nibbleLoL = (Byte)(nibblesL & 0xF);
288 >
289 >                                samplesL[iSampleL++] = NibbletoSampleIMA4(ref predictorL, ref stepIndexL, nibbleLoL);
290 >                                samplesL[iSampleL++] = NibbletoSampleIMA4(ref predictorL, ref stepIndexL, nibbleHiL);
291 >                            }
292 >
293 >                            if (sound.ChannelCount == 2)
294 >                            {
295 >                                byte headerHiR = sound.Data[pos++];
296 >                                byte headerLoR = sound.Data[pos++];
297 >                                if (block == 0) // non-standard decoding: predictor initialization ignored after start
298 >                                {
299 >                                    predictorR = ((((headerHiR << 1) | (headerLoR >> 7))) << 7);
300 >                                    if (predictorR > 32767) predictorR -= 65536;
301 >                                }
302 >                                stepIndexR = headerLoR & 0x7f;
303 >                                if (stepIndexR > 88)
304 >                                    Console.WriteLine("Block {0} (R): Initial IMA4 step index is {1}, clamping to 88.", block, stepIndexR);
305 >                                ClampToRange(ref stepIndexR, 0, 88);
306 >
307 >                                for (int b = 0; b < 32; b++)
308 >                                {
309 >                                    Byte nibblesR = sound.Data[pos++];
310 >                                    Byte nibbleHiR = (Byte)(nibblesR >> 4);
311 >                                    Byte nibbleLoR = (Byte)(nibblesR & 0xF);
312 >
313 >                                    samplesR[iSampleR++] = NibbletoSampleIMA4(ref predictorR, ref stepIndexR, nibbleLoR);
314 >                                    samplesR[iSampleR++] = NibbletoSampleIMA4(ref predictorR, ref stepIndexR, nibbleHiR);
315 >                                }
316 >                            }
317 >                        }
318 >                    }
319 >                    else // decode MSADPCM into linear signed 16-bit PCM
320 >                    {
321 >                        int pos = 0;
322 >                        Byte pred_indexL = 0, pred_indexR = 0;
323 >                        UInt16 deltaL = 0, deltaR = 0;
324 >                        int iSampleL = 0;
325 >                        int iSampleR = 0;
326 >                        Int16 sample1L = 0, sample2L = 0;
327 >                        Int16 sample1R = 0, sample2R = 0;
328 >
329 >                        while (pos < sound.Data.Length)
330 >                        {
331 >                            if ((pos % blockSizeADPCM) == 0) // read block header
332 >                            {
333 >                                pred_indexL = sound.Data[pos++];
334 >                                if (sound.ChannelCount == 2)
335 >                                    pred_indexR = sound.Data[pos++];
336 >                                Byte deltaLo = sound.Data[pos++];
337 >                                Byte deltaHi = sound.Data[pos++];
338 >                                deltaL = (UInt16)(deltaLo + 256 * deltaHi);
339 >                                if (sound.ChannelCount == 2)
340 >                                {
341 >                                    deltaLo = sound.Data[pos++];
342 >                                    deltaHi = sound.Data[pos++];
343 >                                    deltaR = (UInt16)(deltaLo + 256 * deltaHi);
344 >                                }
345 >                                Byte sampleLo = sound.Data[pos++];
346 >                                Byte sampleHi = sound.Data[pos++];
347 >                                UInt16 usample = (UInt16)(sampleLo + 256 * sampleHi);
348 >                                sample1L = (Int16)((usample < 32767) ? usample : (usample - 65536));
349 >                                if (sound.ChannelCount == 2)
350 >                                {
351 >                                    sampleLo = sound.Data[pos++];
352 >                                    sampleHi = sound.Data[pos++];
353 >                                    usample = (UInt16)(sampleLo + 256 * sampleHi);
354 >                                    sample1R = (Int16)((usample < 32767) ? usample : (usample - 65536));
355 >                                }
356 >                                sampleLo = sound.Data[pos++];
357 >                                sampleHi = sound.Data[pos++];
358 >                                usample = (UInt16)(sampleLo + 256 * sampleHi);
359 >                                sample2L = (Int16)((usample < 32767) ? usample : (usample - 65536));
360 >                                if (sound.ChannelCount == 2)
361 >                                {
362 >                                    sampleLo = sound.Data[pos++];
363 >                                    sampleHi = sound.Data[pos++];
364 >                                    usample = (UInt16)(sampleLo + 256 * sampleHi);
365 >                                    sample2R = (Int16)((usample < 32767) ? usample : (usample - 65536));
366 >                                }
367 >                                samplesL[iSampleL++] = sample2L;
368 >                                samplesL[iSampleL++] = sample1L;
369 >                                if (sound.ChannelCount == 2)
370 >                                {
371 >                                    samplesR[iSampleR++] = sample2R;
372 >                                    samplesR[iSampleR++] = sample1R;
373 >                                }
374 >                            }
375 >                            else // read pair of nibbles
376 >                            {
377 >                                Byte nibbles = sound.Data[pos++];
378 >                                Byte nibbleHi = (Byte)(nibbles >> 4);
379 >                                Byte nibbleLo = (Byte)(nibbles & 0xF);
380 >                                samplesL[iSampleL++] = NibbletoSampleMSADPCM(ref sample1L, ref sample2L, ref deltaL, pred_indexL, nibbleHi);
381 >                                if (sound.ChannelCount == 2)
382 >                                    samplesR[iSampleR++] = NibbletoSampleMSADPCM(ref sample1R, ref sample2R, ref deltaR, pred_indexR, nibbleLo);
383 >                                else
384 >                                    samplesL[iSampleL++] = NibbletoSampleMSADPCM(ref sample1L, ref sample2L, ref deltaL, pred_indexL, nibbleLo);
385 >                            }
386 >                        }
387 >                    }
388 >                    writer.Write(fcc_data);
389 >                    writer.Write(dataSize);
390 >                    for (int smp = 0; smp < sampleCount; smp++)
391 >                    {
392 >                        writer.Write(samplesL[smp]);
393 >                        if(sound.ChannelCount == 2)
394 >                            writer.Write(samplesR[smp]);
395 >                    }
396 >                }
397              }
398          }
399      }

Diff Legend

Removed lines
+ Added lines
< Changed lines (old)
> Changed lines (new)