the-assignment/classifier/streamClassify.py

import pyaudio
import struct
import math
import pandas as pd

from feature_extraction.feature_extractor import extractFeatures
from preprocessing.data_preprocessing import createSingleFeaturesArray, standardization
from training.model_training import kFCrossValid, simpleTrain

FORMAT = pyaudio.paInt16
SHORT_NORMALIZE = (1.0/32768.0)
CHANNELS = 1
RATE = 22050
INPUT_BLOCK_TIME = int(6144 / RATE)
INPUT_FRAMES_PER_BLOCK = 6144

def classify(block, clf):
	import numpy as np

	audio_data = np.fromstring(block, np.int16)
	audio_data = audio_data.astype(int)

	values = extractFeatures(audio_data, 'tmp.json', RATE)
	audioClass = clf.predict(values)

	return audioClass

class micListener(object):
	def __init__(self):
		self.pa = pyaudio.PyAudio()
		self.stream = self.open_mic_stream()

		print('Training...')
		dataset, target, featureKeys = createSingleFeaturesArray(
			'feature_extraction/music_features/',
			'feature_extraction/speech_features/')

		self.clf = kFCrossValid(dataset, target, model = 'rndForest')
		print('Training done!')

	def stop(self):
		self.stream.close()

	def find_input_device(self):
		device_index = None
		for i in range( self.pa.get_device_count() ):
			devinfo = self.pa.get_device_info_by_index(i)
			print( "Device %d: %s"%(i,devinfo["name"]) )

			for keyword in ["mic","input"]:
				if keyword in devinfo["name"].lower():
					print( "Found an input: device %d - %s"%(i,devinfo["name"]) )
					device_index = i
					return device_index

		if device_index == None:
			print( "No preferred input found; using default input device." )

		return device_index

	def open_mic_stream( self ):
		device_index = self.find_input_device()

		stream = self.pa.open(format = FORMAT, channels = CHANNELS, rate = RATE,
			input = True, input_device_index = device_index,
			frames_per_buffer = INPUT_FRAMES_PER_BLOCK)

		return stream

	def listen(self):
		try:
			block = self.stream.read(INPUT_FRAMES_PER_BLOCK)
		except IOError as e:
			# dammit.
			print('IOError!')
			return

		audioClass = classify(block, self.clf)
		print(audioClass)

if __name__ == "__main__":
	micStr = micListener()

	for i in range(300):
		micStr.listen()
Init real time classification 6 years ago			`import pyaudio`
			`import struct`
			`import math`
			`import pandas as pd`

			`from feature_extraction.feature_extractor import extractFeatures`
			`from preprocessing.data_preprocessing import createSingleFeaturesArray, standardization`
			`from training.model_training import kFCrossValid, simpleTrain`

			`FORMAT = pyaudio.paInt16`
			`SHORT_NORMALIZE = (1.0/32768.0)`
			`CHANNELS = 1`
			`RATE = 22050`
			`INPUT_BLOCK_TIME = int(6144 / RATE)`
			`INPUT_FRAMES_PER_BLOCK = 6144`

			`def classify(block, clf):`
			`import numpy as np`

			`audio_data = np.fromstring(block, np.int16)`
			`audio_data = audio_data.astype(int)`

			`values = extractFeatures(audio_data, 'tmp.json', RATE)`
			`audioClass = clf.predict(values)`

			`return audioClass`

			`class micListener(object):`
			`def __init__(self):`
			`self.pa = pyaudio.PyAudio()`
			`self.stream = self.open_mic_stream()`

			`print('Training...')`
			`dataset, target, featureKeys = createSingleFeaturesArray(`
			`'feature_extraction/music_features/',`
			`'feature_extraction/speech_features/')`

			`self.clf = kFCrossValid(dataset, target, model = 'rndForest')`
			`print('Training done!')`

			`def stop(self):`
			`self.stream.close()`

			`def find_input_device(self):`
			`device_index = None`
			`for i in range( self.pa.get_device_count() ):`
			`devinfo = self.pa.get_device_info_by_index(i)`
			`print( "Device %d: %s"%(i,devinfo["name"]) )`

			`for keyword in ["mic","input"]:`
			`if keyword in devinfo["name"].lower():`
			`print( "Found an input: device %d - %s"%(i,devinfo["name"]) )`
			`device_index = i`
			`return device_index`

			`if device_index == None:`
			`print( "No preferred input found; using default input device." )`

			`return device_index`

			`def open_mic_stream( self ):`
			`device_index = self.find_input_device()`

			`stream = self.pa.open(format = FORMAT, channels = CHANNELS, rate = RATE,`
			`input = True, input_device_index = device_index,`
			`frames_per_buffer = INPUT_FRAMES_PER_BLOCK)`

			`return stream`

			`def listen(self):`
			`try:`
			`block = self.stream.read(INPUT_FRAMES_PER_BLOCK)`
			`except IOError as e:`
			`# dammit.`
			`print('IOError!')`
			`return`

			`audioClass = classify(block, self.clf)`
			`print(audioClass)`

			`if __name__ == "__main__":`
			`micStr = micListener()`

			`for i in range(300):`
			`micStr.listen()`