Browse Source

thewria deleted

master
Christina Theodoridou 6 years ago
parent
commit
7a9260de13
  1. 1039
      tex/figures/smrl.eps
  2. 40
      tex/main.aux
  3. 47
      tex/main.log
  4. BIN
      tex/main.pdf
  5. BIN
      tex/main.synctex.gz
  6. 62
      tex/main.tex
  7. 10
      tex/main.toc

1039
tex/figures/smrl.eps

File diff suppressed because it is too large

40
tex/main.aux

@ -23,41 +23,43 @@
\@writefile{toc}{\contentsline {subsection}{\numberline {2.3}\textit {function} frameT = iFilterbank(frameF, frameType, winType)}{3}{subsection.2.3}}
\@writefile{toc}{\contentsline {subsection}{\numberline {2.4}\textit {function} AACSeq1 = AACoder1(fNameIn)}{3}{subsection.2.4}}
\@writefile{toc}{\contentsline {subsection}{\numberline {2.5}\textit {function} x = iAACoder1(AACSeq1, fNameOut)}{3}{subsection.2.5}}
\@writefile{toc}{\contentsline {subsection}{\numberline {2.6}\textit {function} SNR = demoAAC1(fNameIn, fNameOut)}{4}{subsection.2.6}}
\@writefile{toc}{\contentsline {subsection}{\numberline {2.6}\textit {function} SNR = demoAAC1(fNameIn, fNameOut)}{3}{subsection.2.6}}
\@writefile{lof}{\contentsline {figure}{\numberline {1}{\ignorespaces Το frame στο πεδίο του χρόνου πριν τροφοδοτηθεί σε συναρτήσεις\relax }}{4}{figure.caption.2}}
\@writefile{lof}{\contentsline {figure}{\numberline {2}{\ignorespaces Μετάβαση στο πεδίο της συχνότητας με την συνάρτηση filterbank, συντελεστές MDCT \relax }}{4}{figure.caption.3}}
\@writefile{lof}{\contentsline {figure}{\numberline {3}{\ignorespaces Η επιστροφή στο πεδίου του χρόνου μέσω της συνάρτησης iFilterbank\relax }}{4}{figure.caption.4}}
\@writefile{lof}{\contentsline {figure}{\numberline {4}{\ignorespaces Κοινό διάγραμμα αρχικού σήματος με το σήμα εξόδου της iFilterbank\relax }}{5}{figure.caption.5}}
\@writefile{lof}{\contentsline {figure}{\numberline {4}{\ignorespaces Κοινό διάγραμμα αρχικού σήματος με το σήμα εξόδου της iFilterbank\relax }}{4}{figure.caption.5}}
\providecommand*\caption@xref[2]{\@setref\relax\@undefined{#1}}
\newlabel{ref:1}{{4}{5}{Κοινό διάγραμμα αρχικού σήματος με το σήμα εξόδου της iFilterbank\relax }{figure.caption.5}{}}
\newlabel{ref:1}{{4}{4}{Κοινό διάγραμμα αρχικού σήματος με το σήμα εξόδου της iFilterbank\relax }{figure.caption.5}{}}
\@writefile{toc}{\contentsline {section}{\numberline {3}2o Επίπεδο}{5}{section.3}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.1}\textit {function} [frameFout, TNScoeffs] = TNS(frameFin, frameType)}{5}{subsection.3.1}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.2}\textit {function} frameFout = iTNS(frameFin, frameType, TNScoeffs)}{5}{subsection.3.2}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.3}\textit {function} AACSeq2 = AACoder2(fNameIn)}{6}{subsection.3.3}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.4}\textit {function} x = iAACoder2(AACSeq2, fNameOut)}{6}{subsection.3.4}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.3}\textit {function} AACSeq2 = AACoder2(fNameIn)}{5}{subsection.3.3}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.4}\textit {function} x = iAACoder2(AACSeq2, fNameOut)}{5}{subsection.3.4}}
\@writefile{toc}{\contentsline {subsection}{\numberline {3.5}\textit {function} SNR = demoAAC2(fNameIn, fNameOut)}{6}{subsection.3.5}}
\@writefile{lof}{\contentsline {figure}{\numberline {5}{\ignorespaces Κοινό διάγραμμα αρχικού σήματος με το σήμα εξόδου της iAACoder2\relax }}{6}{figure.caption.6}}
\newlabel{ref:2}{{5}{6}{Κοινό διάγραμμα αρχικού σήματος με το σήμα εξόδου της iAACoder2\relax }{figure.caption.6}{}}
\@writefile{toc}{\contentsline {section}{\numberline {4}3ο Επίπεδο}{7}{section.4}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.1}\textit {function} SMR = psycho(frameT, frameType, frameTprev1, frameTprev2) }{7}{subsection.4.1}}
\@writefile{toc}{\contentsline {section}{\numberline {4}3ο Επίπεδο}{6}{section.4}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.1}\textit {function} SMR = psycho(frameT, frameType, frameTprev1, frameTprev2) }{6}{subsection.4.1}}
\@writefile{lof}{\contentsline {figure}{\numberline {6}{\ignorespaces Κατώφλι ακουστότητας για το αριστερό κανάλι του 2ου frame\relax }}{7}{figure.caption.7}}
\newlabel{ref:6}{{6}{7}{Κατώφλι ακουστότητας για το αριστερό κανάλι του 2ου frame\relax }{figure.caption.7}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {7}{\ignorespaces Signal to Mask Ratio για το αριστερό κανάλι του 2ου frame\relax }}{7}{figure.caption.8}}
\newlabel{ref:10}{{7}{7}{Signal to Mask Ratio για το αριστερό κανάλι του 2ου frame\relax }{figure.caption.8}{}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.2}\textit {function} [S, sfc, G] = AACquantizer(frameF, frameType, SMR)}{7}{subsection.4.2}}
\@writefile{lof}{\contentsline {figure}{\numberline {7}{\ignorespaces Συντελεστές MDCT πριν τον κβαντισμό\relax }}{8}{figure.caption.8}}
\newlabel{ref:3}{{7}{8}{Συντελεστές MDCT πριν τον κβαντισμό\relax }{figure.caption.8}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {8}{\ignorespaces Επίπεδα κβαντισμού\relax }}{8}{figure.caption.9}}
\newlabel{ref:4}{{8}{8}{Επίπεδα κβαντισμού\relax }{figure.caption.9}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {9}{\ignorespaces Κβαντισμένοι συντελεστές\relax }}{8}{figure.caption.10}}
\newlabel{ref:5}{{9}{8}{Κβαντισμένοι συντελεστές\relax }{figure.caption.10}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {8}{\ignorespaces Συντελεστές MDCT πριν τον κβαντισμό\relax }}{8}{figure.caption.9}}
\newlabel{ref:3}{{8}{8}{Συντελεστές MDCT πριν τον κβαντισμό\relax }{figure.caption.9}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {9}{\ignorespaces Επίπεδα κβαντισμού\relax }}{8}{figure.caption.10}}
\newlabel{ref:4}{{9}{8}{Επίπεδα κβαντισμού\relax }{figure.caption.10}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {10}{\ignorespaces Κβαντισμένοι συντελεστές\relax }}{8}{figure.caption.11}}
\newlabel{ref:5}{{10}{8}{Κβαντισμένοι συντελεστές\relax }{figure.caption.11}{}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.3}\textit {function} frameF = iAACquantizer(S, sfc, G, frameType)}{8}{subsection.4.3}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.4}\textit {function} [huffSec, huffCodebook] = encodeHuff(coeffSec, huffLUT, forcedCodebook)}{9}{subsection.4.4}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.5}\textit {function} decCoeffs = decodeHuff(huffSec, huffCodebook, huffLUT)}{9}{subsection.4.5}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.6}\textit {function} AACSeq3 = AACoder3(fNameIn, fnameAACoded)}{9}{subsection.4.6}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.7}\textit {function} x = iAACoder3(AACSeq3, fNameOut)}{9}{subsection.4.7}}
\@writefile{toc}{\contentsline {subsection}{\numberline {4.8}\textit {function} [SNR, bitrate, compression] = demoAAC3(fNameIn, fNameOut, frameAACoded)}{9}{subsection.4.8}}
\@writefile{lof}{\contentsline {figure}{\numberline {10}{\ignorespaces Αρχικό (μαύρο) και αποκωδικοποιημένο (κόκκινο) σήμα\relax }}{10}{figure.caption.12}}
\newlabel{ref:7}{{10}{10}{Αρχικό (μαύρο) και αποκωδικοποιημένο (κόκκινο) σήμα\relax }{figure.caption.12}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {11}{\ignorespaces Διαφορά σημάτων σε κάθε δείγμα\relax }}{10}{figure.caption.13}}
\newlabel{ref:8}{{11}{10}{Διαφορά σημάτων σε κάθε δείγμα\relax }{figure.caption.13}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {12}{\ignorespaces Απόλυτη διαφορά σημάτων\relax }}{11}{figure.caption.14}}
\newlabel{ref:9}{{12}{11}{Απόλυτη διαφορά σημάτων\relax }{figure.caption.14}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {11}{\ignorespaces Αρχικό (μαύρο) και αποκωδικοποιημένο (κόκκινο) σήμα\relax }}{10}{figure.caption.13}}
\newlabel{ref:7}{{11}{10}{Αρχικό (μαύρο) και αποκωδικοποιημένο (κόκκινο) σήμα\relax }{figure.caption.13}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {12}{\ignorespaces Διαφορά σημάτων σε κάθε δείγμα\relax }}{10}{figure.caption.14}}
\newlabel{ref:8}{{12}{10}{Διαφορά σημάτων σε κάθε δείγμα\relax }{figure.caption.14}{}}
\@writefile{lof}{\contentsline {figure}{\numberline {13}{\ignorespaces Απόλυτη διαφορά σημάτων\relax }}{11}{figure.caption.15}}
\newlabel{ref:9}{{13}{11}{Απόλυτη διαφορά σημάτων\relax }{figure.caption.15}{}}

47
tex/main.log

@ -1,4 +1,4 @@
This is XeTeX, Version 3.14159265-2.6-0.99998 (TeX Live 2017/Debian) (preloaded format=xelatex 2018.11.1) 17 FEB 2019 21:00
This is XeTeX, Version 3.14159265-2.6-0.99998 (TeX Live 2017/Debian) (preloaded format=xelatex 2018.11.1) 17 FEB 2019 21:58
entering extended mode
restricted \write18 enabled.
%&-line parsing enabled.
@ -763,7 +763,11 @@ LaTeX Info: Redefining \rmfamily on input line 23.
.................................................
LaTeX Info: Redefining \ttfamily on input line 24.
Package hyperref Info: Option `colorlinks' set `true' on input line 39.
(./main.aux)
(./main.aux
LaTeX Warning: Label `ref:9' multiply defined.
)
\openout1 = `main.aux'.
LaTeX Font Info: Checking defaults for OML/cmm/m/it on input line 42.
@ -918,9 +922,10 @@ File: se-ascii-print.def 2016/05/16 v1.11 stringenc: Printable ASCII characters
)
[1
] [2] [3]
] [2]
File: figures/frame_2_original.eps Graphic file (type eps)
<figures/frame_2_original.eps>
[3]
File: figures/frame_2_left_filtered.eps Graphic file (type eps)
<figures/frame_2_left_filtered.eps>
File: figures/frame_2_left_iFiltered.eps Graphic file (type eps)
@ -929,7 +934,7 @@ File: figures/frame_2_comparison_filtered_and_ifiltered.eps Graphic file (type
eps)
<figures/frame_2_comparison_filtered_and_ifiltered.eps>
[4]
Overfull \hbox (4.94525pt too wide) in paragraph at lines 155--157
Overfull \hbox (4.94525pt too wide) in paragraph at lines 158--160
\TU/Lato(0)/m/n/10.95 με την ενέργεια της μπάντας στην οποία ανήκουν. Με την βο
ήθεια της συνάρτησης lpc του MATLAB,
[]
@ -937,9 +942,11 @@ Overfull \hbox (4.94525pt too wide) in paragraph at lines 155--157
[5]
File: figures/frame_2_comparison_iTNS.eps Graphic file (type eps)
<figures/frame_2_comparison_iTNS.eps>
[6]
File: figures/psycho_thres_frame2_right.eps Graphic file (type eps)
<figures/psycho_thres_frame2_right.eps>
[6]
File: figures/smrl.eps Graphic file (type eps)
<figures/smrl.eps>
File: figures/frame_2_mdct_coef_before.eps Graphic file (type eps)
<figures/frame_2_mdct_coef_before.eps>
[7]
@ -948,38 +955,42 @@ File: figures/quant_levels.eps Graphic file (type eps)
File: figures/frame_2_SL.eps Graphic file (type eps)
<figures/frame_2_SL.eps>
[8]
Overfull \hbox (20.04814pt too wide) in paragraph at lines 282--282
Overfull \hbox (20.04814pt too wide) in paragraph at lines 294--294
[]\TU/Lato(0)/bx/it/12 function \TU/Lato(0)/bx/n/12 [SNR, bitrate, compression]
= demoAAC3(fNameIn, fNameOut, frameAACoded)
[]
LaTeX Warning: No positions in optional float specifier.
Default added (so using `tbp') on input line 289.
Default added (so using `tbp') on input line 301.
[9]
File: figures/decoded_encoded.eps Graphic file (type eps)
<figures/decoded_encoded.eps>
[9]
File: figures/difference.eps Graphic file (type eps)
<figures/difference.eps>
File: figures/bar_abs_dif.eps Graphic file (type eps)
<figures/bar_abs_dif.eps>
[10]
Package atveryend Info: Empty hook `BeforeClearDocument' on input line 329.
Package atveryend Info: Empty hook `BeforeClearDocument' on input line 341.
[11]
Package atveryend Info: Empty hook `AfterLastShipout' on input line 329.
Package atveryend Info: Empty hook `AfterLastShipout' on input line 341.
(./main.aux)
Package atveryend Info: Empty hook `AtVeryEndDocument' on input line 329.
Package atveryend Info: Empty hook `AtEndAfterFileList' on input line 329.
Package atveryend Info: Empty hook `AtVeryVeryEnd' on input line 329.
Package atveryend Info: Empty hook `AtVeryEndDocument' on input line 341.
Package atveryend Info: Empty hook `AtEndAfterFileList' on input line 341.
LaTeX Warning: There were multiply-defined labels.
Package atveryend Info: Empty hook `AtVeryVeryEnd' on input line 341.
)
Here is how much of TeX's memory you used:
20870 strings out of 493007
394285 string characters out of 6136719
498564 words of memory out of 5000000
24683 multiletter control sequences out of 15000+600000
20864 strings out of 493007
394202 string characters out of 6136719
497564 words of memory out of 5000000
24676 multiletter control sequences out of 15000+600000
536860 words of font info for 71 fonts, out of 8000000 for 9000
1348 hyphenation exceptions out of 8191
39i,11n,65p,10407b,336s stack positions out of 5000i,500n,10000p,200000b,80000s
39i,11n,65p,10407b,357s stack positions out of 5000i,500n,10000p,200000b,80000s
Output written on main.pdf (11 pages).

BIN
tex/main.pdf

Binary file not shown.

BIN
tex/main.synctex.gz

Binary file not shown.

62
tex/main.tex

@ -26,7 +26,7 @@
\title{Συστήματα Πολυμέσων και Εικονική Πραγματικότητα\\
Εργασία 2018-2019}
\author{Χριστίνα Θεοδωρίδου - 8055\\
Aποστόλης Φανάκης- αεμ}
Aποστόλης Φανάκης- 8261}
\date{\today}
\pagestyle{fancy}
@ -46,7 +46,7 @@
\newpage
\section{Εισαγωγή}
Στην εργασία αυτή παρουσιάζεται μια απλοποιημένη εκδοχή του κωδικοποιητή και αποκωδικοποιητή AAC. Στην παρούσα αναφορά, περιγράφεται ο τρόπος υλοποίησης των βαθμίδων στο MATLAB και ο τρόπος χρήσης των συναρτήσεων από τις οποίες αποτελούνται, μαζί με κάποια ενδεικτικά αποτελέσματα.
Στην εργασία αυτή παρουσιάζεται μια απλοποιημένη εκδοχή του κωδικοποιητή και αποκωδικοποιητή AAC. Στην παρούσα αναφορά, περιγράφεται ο τρόπος υλοποίησης των βαθμίδων στο MATLAB και ο τρόπος χρήσης των συναρτήσεων από τις οποίες αποτελούνται, μαζί με κάποια ενδεικτικά αποτελέσματα. Το αρχείο που χρησιμοποιήθηκε για τα πειράματα είναι το δοσμένο 'LicorDeCalandraca.wav', το οποίο είναι δειγματοληπτημένο στα 48KHz και έχει 2 κανάλια. Τέλος, κατά την εκτέλεση των προγραμμάτων χρησιμοποιούνται οι συναρτήσεις mdct4 και imdct4 οι οποίες έχουν ληφθεί από προτεινόμενη ιστοσελίδα. \footnote{http://www.ee.columbia.edu/\~marios/mdct/mdct\_giraffe.html}
\section{1o Επίπεδο}
@ -56,26 +56,29 @@
Η πρώτη συνάρτηση που υλοποιήθηκε αφορά την βαθμίδα Sequence Segmentation Control, και σκοπός της είναι να καθορίσει τον τύπο ενός frame. Το πρώτο όρισμά της είναι ένας πίνακας 2048x2 , που περιέχει 2 κανάλια ήχου στο χρόνο, του frame του οποίου τον τύπο θέλουμε να διαπιστώσουμε. Αντίστοιχα, το δεύτερο όρισμα περιέχει τα κανάλια του του αμέσως επόμενου frame ενώ το τρίτο, αφορά τον τύπο του αμέσως προηγούμενου frame, ο οποίος μπορεί να πάρει 1 από τις αλφαριθμητικές τιμές "OLS" (ONLY\_LONG\_SEQUENCE), "LSS" (LONG\_START\_SEQUENCE), "ESH" (EIGHT\_SHORT\_SEQUENCE) και "LPS" (LONG\_STOP\_SEQUENCE) , ανάλογα το περιεχόμενο του.
Για να αποφανθούμε για τον τύπο του frame, εξετάζεται το αμέσως επόμενο frame, δηλαδή το frame $i+1$. Τα βήματα που ακολουθούνται είναι τα εξής:
\begin{enumerate}
\item Τα δείγματά του, παιρνούν από το υψιπερατό φίλτρο
$ H(z) = \frac{0.7548 - 0.7548z^{-1}}{1- 0.5095z^{-1}}$, με την βοήθεια της συνάρτησης filter.
\item Για κάθε μία από τις 8 υποπεριοχές του (subframes), υπολογίζεται η ενέργειά τους $s_{l}^{2}$, $(l = 0,..,7)$ , δηλαδή το άθροισμα των τετραγώνων των δειγμάτων τους, και αποθηκεύεται στο energyEstimations.
\item Υπολογίζονται τα attack values $ds_{l}^{2} = \frac{s_{l}^{2}}{(1/l) \cdot \Sigma_{k=0}^{l-1} s_{k}^{2}}$ και αποθηκεύονται στο energyRatios.
\item Το frame $i+1$ θα είναι "ESH" εάν ισχύουν ταυτόχρονα:
\begin{itemize}
\item $s_{l}^{2} > 10^{-3}$
\item $ds_{l}^{2} > 10$
\end{itemize}
\end{enumerate}
Ανάλογα με την ισχύ ή όχι των παραπάνω συνθηκών και δεδομένου του τύπου του προηγούμενου frame, είναι δυνατή η απόφαση του τύπου του frame i, με τη λογική που παρουσιάζεται στο πρότυπο και την εκφώνηση της εργασίας. Για αυτό τον λόγο, στη συνέχεια, συγκρίνονται οι τύποι του επόμενου και του προηγούμενου frame και λαμβάνεται η απόφαση για τον τύπου του κάθε καναλιού. Για την απόφαση του τύπου ολόκληρου του frame, είναι απαραίτητος ο συνδυασμός των αποφάσεων των τύπων των δύο καναλιών σύμφωνα και πάλι με δοθείσα λογική.
Tα frame τα οποία είναι στατικά χαρακτηρίζονται ως 'OLS' ενώ τα frames με διακυμάνσεις ως 'ESH'. Τα μεταβατικά παράθυρα μεταξύ αυτών των κύριων κατηγοριών είναι τα 'LSS' και 'LPS'. Ο τρόπος με τον οποίον γίνεται η κατηγοριοποίηση περιγράφεται αναλυτικά στο πρότυπο του AAC. Γενικά, με τα βήματα που ακολουθούνται εξάγεται αρχικά ένα συμπέρασμα για κάθε κανάλι ξεχωριστά και έπειτα με μια συνδυαστική λογική που επίσης περιγράφεται στο πρότυπο, γίνεται ο συνδυασμός των αποφάσεων για να προκύψει ο τελικός τύπος του παραθύρου.
% εξετάζεται το αμέσως επόμενο frame, δηλαδή το frame $i+1$. Τα βήματα που ακολουθούνται είναι τα εξής:
% \begin{enumerate}
% \item Τα δείγματά του, παιρνούν από το υψιπερατό φίλτρο
% $ H(z) = \frac{0.7548 - 0.7548z^{-1}}{1- 0.5095z^{-1}}$, με την βοήθεια της συνάρτησης filter.
% \item Για κάθε μία από τις 8 υποπεριοχές του (subframes), υπολογίζεται η ενέργειά τους $s_{l}^{2}$, $(l = 0,..,7)$ , δηλαδή το άθροισμα των τετραγώνων των δειγμάτων τους, και αποθηκεύεται στο energyEstimations.
% \item Υπολογίζονται τα attack values $ds_{l}^{2} = \frac{s_{l}^{2}}{(1/l) \cdot \Sigma_{k=0}^{l-1} s_{k}^{2}}$ και αποθηκεύονται στο energyRatios.
% \item Το frame $i+1$ θα είναι "ESH" εάν ισχύουν ταυτόχρονα:
% \begin{itemize}
% \item $s_{l}^{2} > 10^{-3}$
% \item $ds_{l}^{2} > 10$
% \end{itemize}
% \end{enumerate}
% Ανάλογα με την ισχύ ή όχι των παραπάνω συνθηκών και δεδομένου του τύπου του προηγούμενου frame, είναι δυνατή η απόφαση του τύπου του frame i, με τη λογική που παρουσιάζεται στο πρότυπο και την εκφώνηση της εργασίας. Για αυτό τον λόγο, στη συνέχεια, συγκρίνονται οι τύποι του επόμενου και του προηγούμενου frame και λαμβάνεται η απόφαση για τον τύπου του κάθε καναλιού. Για την απόφαση του τύπου ολόκληρου του frame, είναι απαραίτητος ο συνδυασμός των αποφάσεων των τύπων των δύο καναλιών σύμφωνα και πάλι με δοθείσα λογική.
\subsection{\textit{function} frameF = filterbank(frameT, frameType, winType)}
Η συνάρτηση αυτή αφορά την βαθμίδα filterbank και έχει ως ορίσματα ένα frame ήχου 2048x2, τον τύπο του καθώς και τον τύπο παραθύρου που θα χρησιμοποηθεί. Η δε έξοδός του, είναι η αναπαράσταση του ίδιου του frame στο πεδίο της συχνότητας, σε όρους MDCT. Στην περίπτωση που το frame είναι τύπου "ESH", η συνάρτηση θα επιστρέφει 8 υποπίνακες 128x2 με τους συντελεστές του MDCT, έναν για κάθε subframe ενώ σε άλλη περίπτωση, θα επιστρέφει έναν πίνακα 1024x2.
Για να γίνει η μετάβαση αυτή ακολουθείται η διαδικασία που περιγράφεται στο πρότυπο. Αρχικά, στην υλοποιημένη συνάρτηση, δημιουργούνται οι τύποι των παραθύρων "KBD"και "SIN" που θα χρησιμοποιηθούν αργότερα, σε εκδοχές short και long για subframes και frames μήκους 256 και 2048 αντίστοιχα. Στη συνέχεια, σύμφωνα με το frameType και winType που δίνονται, εφαρμόζεται στο frameT το κατάλληλο παράθυρο, με τον τρόπο που υποδεικνύεται στην εκφώνηση και καλείται η συνάρτηση mdct4 \footnote{http://www.ee.columbia.edu/\~marios/mdct/mdct\_giraffe.html} έτσι ώστε να ληφθούν οι συντελεστές MDCT.
Για να γίνει η μετάβαση αυτή ακολουθείται η διαδικασία που περιγράφεται στο πρότυπο. Αρχικά, στην υλοποιημένη συνάρτηση, δημιουργούνται οι τύποι των παραθύρων "KBD"και "SIN" που θα χρησιμοποιηθούν αργότερα, σε εκδοχές short και long για subframes και frames μήκους 256 και 2048 αντίστοιχα. Στη συνέχεια, σύμφωνα με το frameType και winType που δίνονται, εφαρμόζεται στο frameT το κατάλληλο παράθυρο, με τον τρόπο που υποδεικνύεται στην εκφώνηση και καλείται η συνάρτηση mdct4 έτσι ώστε να ληφθούν οι συντελεστές MDCT.
Στην περίπτωση που ο τύπος του frame είναι "ESH", πρώτα το χωρίζουμε σε 8 subframes και έπειτα εφαρμόζουμε την παραθυροποίηση και τον mdct.
@ -107,7 +110,7 @@
Στην συνάρτηση αυτή, επιδεικνύεται η λειτουργία του κωδικοποιητή και του αποκωδικοποιητή και επιστρέφεται ο σηματοθορυβικός λόγος των εξόδων τους. Δέχεται ως ορίσματα το path του αρχείου που επιθυμούμε να κωδικοποιήσουμε και το όνομα που θα του δοθεί μετά την αποκωδικοποίηση. Για την εύρεση του σηματοθορυβικού λόγου χρησιμοποιείται η συνάρτηση του MATLAB snr.
Παρακάτω φαίνεται η λειτουργία των παραπάνω συναρτήσεων στο 2ο frame του δείγματος ήχου "LicorDeCalandraca.wav" που δίνεται. Ο λόγος του SNR είναι 301.6522 dB.
Παρακάτω φαίνεται η λειτουργία των παραπάνω συναρτήσεων στο 2ο frame του κομματιού. Ο λόγος του SNR είναι 301.6522 dB.
\begin{figure}[H]
@ -198,8 +201,10 @@ H συνάρτηση αυτή επιδεικνύει την κωδικοποίη
Υλοποιεί την βαθμίδα του ψυχοακουστικού μοντέλου για ένα κανάλι. Δέχεται ως είσοδο το frame στο πεδίο του χρόνου, τον τύπο του και τα 2 προηγούμενα του frames στο ίδιο κανάλι. Σαν έξοδο επιστρέφει τον λόγο σήματος προς μάσκα (Signal to Mask Ratio - SMR).
Ακολουθώντας την διαδικασία που περιγράφεται στο πρότυπο, βρίσκουμε το κατώφλι ακουστότητας που φαίνεται στο \ref{ref:9} ενώ στο \ref{ref:10} φαίνεται το SMR.
Πρώτα αρχικοποιήσαμε τους πίνακες TNS από το πρότυπο και στη συνέχεια υπολογίσαμε όλα τα πιθανά αποτελέσματα της spreading \textit{function} και το παράθυρο Hann, τόσο για long όσο και για short frames. Στη συνέχεια, πολλαπλασιάστηκε το κατάλληλο παράθυρο στο frame i, i-1, i-2 και υπολογίστηκε ο FFT , το πλάτος και η φάση για κάθε ένα από αυτά τα frames. Έπειτα, γίνεται πρόβλεψη για το πλάτος και την φάση του frame, όπως υποδεικνύεται στην εκφώνηση και υπολογίζεται η προβλεψιμότητα του. Υπολογίζοντας την ενέργεια και τη βεβαρυμένη προβλεψιμότητα για κάθε μπάντα μπορούμε να τις συνδυάσουμε με την spreading \textit{function} και να κανονικοποιήσουμε το αποτέλεσμα ώστε να εξάγουμε από αυτό τον δείκτη τονικότητας. Βρίσκουμε το SNR, το μετατρέπουμε σε λόγο ενέργειας, όπως υποδεικνύεται, και υπολογίζουμε το κατώφλι ενέργειας. Τέλος, υπολογίζουμε το επίπεδο θορύβου σε κάθε μπάντα και το SMR.
% Πρώτα αρχικοποιήσαμε τους πίνακες TNS από το πρότυπο και στη συνέχεια υπολογίσαμε όλα τα πιθανά αποτελέσματα της spreading function και το παράθυρο Hann, τόσο για long όσο και για short frames. Στη συνέχεια, πολλαπλασιάστηκε το κατάλληλο παράθυρο στο frame i, i-1, i-2 και υπολογίστηκε ο FFT , το πλάτος και η φάση για κάθε ένα από αυτά τα frames. Έπειτα, γίνεται πρόβλεψη για το πλάτος και την φάση του frame, όπως υποδεικνύεται στην εκφώνηση και υπολογίζεται η προβλεψιμότητα του. Υπολογίζοντας την ενέργεια και τη βεβαρυμένη προβλεψιμότητα για κάθε μπάντα μπορούμε να τις συνδυάσουμε με την spreading function και να κανονικοποιήσουμε το αποτέλεσμα ώστε να εξάγουμε από αυτό τον δείκτη τονικότητας. Βρίσκουμε το SNR, το μετατρέπουμε σε λόγο ενέργειας, όπως υποδεικνύεται, και υπολογίζουμε το κατώφλι ενέργειας. Τέλος, υπολογίζουμε το επίπεδο θορύβου σε κάθε μπάντα και το SMR.
\begin{figure}[H]
\centering
@ -209,12 +214,22 @@ H συνάρτηση αυτή επιδεικνύει την κωδικοποίη
\end{figure}
\begin{figure}[H]
\centering
\includegraphics[width=0.95\columnwidth,height=6cm]{figures/smrl.eps}
\caption{Signal to Mask Ratio για το αριστερό κανάλι του 2ου frame}
\label{ref:10}
\end{figure}
\subsection{\textit{function} [S, sfc, G] = AACquantizer(frameF, frameType, SMR)}
Υπολογίζει εσωτερικά το κατώφλι ακουστότητας T(b) και υλοποιεί τη βαθμίδα του κβαντιστή για κάθε κανάλι. Δέχεται ως εισόδους το frame στο πεδίο της συχνότητας σε όρους συντελεστών MDCT, τον τύπο του και το υπολογισμένο SMR. Σαν έξοδο επιστρέφει τον πίνακα s που περιέχει τα σύμβολα κβάντισης των συντελεστών ΜDCT του frame, τον πίνακα sfc με τις τιμές των Scalefactor για κάθε Scalefactor band και το G που είναι το global gain του frame.
Βρίσκουμε αρχικά το κατώφλι ακουστότητας και έπειτα ακολουθώντας τα βήματα που υποδεικνύονται, αρχικά υπολογίζεται μια τιμή του συντελεστή Scalefactor Gain και υπολογίζεται το σφάλμα. Στη συνέχεια αυξάνεται σταδιακά ο συντελεστής και υπολογίζεται και πάλι το σφάλμα μέχρι να φτάσουμε το κατώφλι ακουστότητας.
% Βρίσκουμε αρχικά το κατώφλι ακουστότητας και έπειτα ακολουθώντας τα βήματα που υποδεικνύονται, αρχικά υπολογίζεται μια τιμή του συντελεστή Scalefactor Gain και υπολογίζεται το σφάλμα. Στη συνέχεια αυξάνεται σταδιακά ο συντελεστής και υπολογίζεται και πάλι το σφάλμα μέχρι να φτάσουμε το κατώφλι ακουστότητας.
Η συνάρτηση παίρνει ως είσοδο τους συντελεστές MDCT που φαίνονται στο \ref{ref:3}
\begin{figure}[H]
@ -266,13 +281,10 @@ H συνάρτηση αυτή επιδεικνύει την κωδικοποίη
\subsection{\textit{function} AACSeq3 = AACoder3(fNameIn, fnameAACoded)}
Υλοποιεί έναν κωδικοποιητή ο οποίος δέχεται σαν είσοδο το path του αρχείου το οποίο πρόκειται να κωδικοποιηθεί και το path του .mat αρχείου που πρόκειται να εγγραφεί μετά την κωδικοποίηση. Ως έξοδο, επιστρέφει ένα struct το οποίο περιέχει για κάθε frame, όπως και πριν τον τύπο του και το παράθυρο που χρησιμοποιήθηκε,ενώ για κάθε κανάλι επιστρέφει τους κβαντισμένους συντελεστές TNS, τα κατώφλια ακουστότητας λόγω του ψυχοακουστικού μοντέλου, τα κβαντισμένα global gains, τους κωδικοποιημένους με Huffman κβαντισμένους συντελεστές MDCT και scalefactors και το Huffman codebook.
Υλοποιεί έναν κωδικοποιητή ο οποίος δέχεται σαν είσοδο το path του αρχείου το οποίο πρόκειται να κωδικοποιηθεί και το path του .mat αρχείου που πρόκειται να εγγραφεί μετά την κωδικοποίηση. Ως έξοδο, επιστρέφει ένα struct με διάσταση k x 1, όπου k, ο αριθμός των frames του αρχείου, το οποίο περιέχει για κάθε frame, όπως και πριν τον τύπο του και το παράθυρο που χρησιμοποιήθηκε,ενώ για κάθε κανάλι επιστρέφει τους κβαντισμένους συντελεστές TNS, τα κατώφλια ακουστότητας λόγω του ψυχοακουστικού μοντέλου, τα κβαντισμένα global gains, τους κωδικοποιημένους με Huffman κβαντισμένους συντελεστές MDCT και scalefactors και το Huffman codebook.
Φορτώνει αρχικά τους πίνακες TNS, διαβάζει το αρχείο προς κωδικοποίηση και αφού το χωρίσει σε frames χρησιμοποεί στη συνέχεια τις συναρτήσεις SSC, filterbank, TNS, psycho, AACquantizer και encodeHuff για να το κωδικοποίησει. Τα αποτελέσματα φαίνονται παρακάτω:
<< ΓΡΑΦΗΜΑ >>
\subsection{\textit{function} x = iAACoder3(AACSeq3, fNameOut)}
Υλοποιεί τον αντίστοιχο αποκωδικοποιητή. Δέχεται ως εισόδους, το struct που προκύπτει από τον κωδικοποιητή AACoder3 και το όνομα μαζί με το path που πρόκειται να πάρει το αποκωδικοποιημένο αρχείο ενώ ως έξοδο επιστρέφει έναν πίνακα με το αποκωδικοποιημένο σήμα. Για την υλοποίηση του χρησιμοποιούνται οι συναρτήσεις decodeHuff, iAACquantizer, iTNS και iFilterbank.
@ -289,7 +301,7 @@ H συνάρτηση αυτή επιδεικνύει την κωδικοποίη
\begin{table}[]
\centering
\begin{tabular}{ll}
\textbf{SNR} & 5.1821 \\
\textbf{SNR} & 5.1821 dB \\
\textbf{bitrate} & 3.1937e+05 \\
\textbf{compression} & 4.8094
\end{tabular}

10
tex/main.toc

@ -5,15 +5,15 @@
\contentsline {subsection}{\numberline {2.3}\textit {function} frameT = iFilterbank(frameF, frameType, winType)}{3}{subsection.2.3}
\contentsline {subsection}{\numberline {2.4}\textit {function} AACSeq1 = AACoder1(fNameIn)}{3}{subsection.2.4}
\contentsline {subsection}{\numberline {2.5}\textit {function} x = iAACoder1(AACSeq1, fNameOut)}{3}{subsection.2.5}
\contentsline {subsection}{\numberline {2.6}\textit {function} SNR = demoAAC1(fNameIn, fNameOut)}{4}{subsection.2.6}
\contentsline {subsection}{\numberline {2.6}\textit {function} SNR = demoAAC1(fNameIn, fNameOut)}{3}{subsection.2.6}
\contentsline {section}{\numberline {3}2o Επίπεδο}{5}{section.3}
\contentsline {subsection}{\numberline {3.1}\textit {function} [frameFout, TNScoeffs] = TNS(frameFin, frameType)}{5}{subsection.3.1}
\contentsline {subsection}{\numberline {3.2}\textit {function} frameFout = iTNS(frameFin, frameType, TNScoeffs)}{5}{subsection.3.2}
\contentsline {subsection}{\numberline {3.3}\textit {function} AACSeq2 = AACoder2(fNameIn)}{6}{subsection.3.3}
\contentsline {subsection}{\numberline {3.4}\textit {function} x = iAACoder2(AACSeq2, fNameOut)}{6}{subsection.3.4}
\contentsline {subsection}{\numberline {3.3}\textit {function} AACSeq2 = AACoder2(fNameIn)}{5}{subsection.3.3}
\contentsline {subsection}{\numberline {3.4}\textit {function} x = iAACoder2(AACSeq2, fNameOut)}{5}{subsection.3.4}
\contentsline {subsection}{\numberline {3.5}\textit {function} SNR = demoAAC2(fNameIn, fNameOut)}{6}{subsection.3.5}
\contentsline {section}{\numberline {4}3ο Επίπεδο}{7}{section.4}
\contentsline {subsection}{\numberline {4.1}\textit {function} SMR = psycho(frameT, frameType, frameTprev1, frameTprev2) }{7}{subsection.4.1}
\contentsline {section}{\numberline {4}3ο Επίπεδο}{6}{section.4}
\contentsline {subsection}{\numberline {4.1}\textit {function} SMR = psycho(frameT, frameType, frameTprev1, frameTprev2) }{6}{subsection.4.1}
\contentsline {subsection}{\numberline {4.2}\textit {function} [S, sfc, G] = AACquantizer(frameF, frameType, SMR)}{7}{subsection.4.2}
\contentsline {subsection}{\numberline {4.3}\textit {function} frameF = iAACquantizer(S, sfc, G, frameType)}{8}{subsection.4.3}
\contentsline {subsection}{\numberline {4.4}\textit {function} [huffSec, huffCodebook] = encodeHuff(coeffSec, huffLUT, forcedCodebook)}{9}{subsection.4.4}

Loading…
Cancel
Save