Προς το περιεχόμενο

Audio resolution test: 192kHz vs 96kHz vs 44.1kHz


Προτεινόμενες αναρτήσεις

θα διατυπωσω μια αποψη, την οποια δεν την εχω βρει καπου γραμμενη, αλλα την εχω συμπερανει (ενδεχομενως λανθασμενα) απο ενα συνδυασμο δυο διαφορετικων θεματων :

 

Ενα φυσικο οργανο περιλαμβανει πρακτικα απειρες αρμονικες και το Θ. Shannon λεει οτι θα φιλτραρουμε τις ανωτερες απο αυτες που επιτρέπονται, ωστε να εχουμε πληρη αναπαρασταση του σηματος. Φαινομενικα, επειδη ακουμε μεχρι 20k (και λιγοτερο στην πραγματικοτητα) λεμε οτι δεν πολυπειραζει και να φιλτραρουμε τις υψηλοτερης ταξης αρμονικες.

 

Επειδη ομως λαμβανει χωρα και το φαινομενο των τονων αθροισματος και διαφορας (οπως και αλλα φαινομενα παραγωγης νεων τονων που δεν εχουν παιχτει, αλλα ακουγονται), αναρωτιεμαι μηπως με το φιλτραρισμα  για να υπακουσουμε στο Shannon , δεν επιτρεπουμε την παρουσια των νεων αυτων αρμονικων (που ειναι ακουστες) που διαμορφωνουν τελικα τη χροια του ηχου ενος φυσικου οργανου.

 

Μηπως ενα απο τα πραγματα που ακουγονται στις ανωτερες δειγματοληψιες ειναι και αυτες οι υψηλης ταξης (ακουστες) αρμονικες που προκυπτουν απο τονους διαφορας ακομα ψηλοτερων (μη ακουστων) αρμονικων;

 

Ωραίο το ερώτημά σου, δυστηχώς δεν έχω την θεωρητική κατάρτιση να σου απαντήσω σε αυτό, μπορώ όμως να το συμπληρώσω θέτοντας μια επιπλέον παράμετρο που ίσως έχει μεγαλύτερη σημασία και έχει να κάνει με τις υπερηχητικές θεμελιώδεις που παράγουν υπο-αρμονικές μέσα στο ακουστό φάσμα και που μάλλον αποκόπτονται και αυτές.

Αυτά βέβαια μπορούν να απαντηθούν μόνο από ανάλογης παιδείας γνώστες, άρα είναι όλα μάλλον φιλολογικού ενδιαφέροντος.

Προσωπικά αυτό που μου μένει είναι ότι τα 192kHz ήταν για μένα μια πολύ ευχάριστη έκπληξη. :)

 

Και να συμπληρώσω βέβαια ότι απλώς αναφερόμαστε στο όταν το σήμα παραμένει σε υψηλή ανάλυση.. η βελτίωση που ακούω από τα 192 στα 44.1 φυσικά δεν προέρχεται από οποιεσδήποτε αρμονικές και αν βγάλουμε εκτός την απουσία φίλτρου αποκοπής του ad converter δεν έχω άλλη εξήγηση...

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντήσεις 88
  • Πρώτη
  • Τελευταία

Περισσότερες συμμετοχές

Περισσότερες συμμετοχές

Εικόνες

θα διατυπωσω μια αποψη, την οποια δεν την εχω βρει καπου γραμμενη, αλλα την εχω συμπερανει (ενδεχομενως λανθασμενα) απο ενα συνδυασμο δυο διαφορετικων θεματων :

 

Ενα φυσικο οργανο περιλαμβανει πρακτικα απειρες αρμονικες και το Θ. Shannon λεει οτι θα φιλτραρουμε τις ανωτερες απο αυτες που επιτρέπονται, ωστε να εχουμε πληρη αναπαρασταση του σηματος. Φαινομενικα, επειδη ακουμε μεχρι 20k (και λιγοτερο στην πραγματικοτητα) λεμε οτι δεν πολυπειραζει και να φιλτραρουμε τις υψηλοτερης ταξης αρμονικες.

 

Επειδη ομως λαμβανει χωρα και το φαινομενο των τονων αθροισματος και διαφορας (οπως και αλλα φαινομενα παραγωγης νεων τονων που δεν εχουν παιχτει, αλλα ακουγονται), αναρωτιεμαι μηπως με το φιλτραρισμα  για να υπακουσουμε στο Shannon , δεν επιτρεπουμε την παρουσια των νεων αυτων αρμονικων (που ειναι ακουστες) που διαμορφωνουν τελικα τη χροια του ηχου ενος φυσικου οργανου.

 

Μηπως ενα απο τα πραγματα που ακουγονται στις ανωτερες δειγματοληψιες ειναι και αυτες οι υψηλης ταξης (ακουστες) αρμονικες που προκυπτουν απο τονους διαφορας ακομα ψηλοτερων (μη ακουστων) αρμονικων;

 

blue,

 

δεν είναι αδικαιολόγητη η απορία σου. Το link αναφέρεται σε combination tones (τόνων αθροίσματος και διαφοράς), οπότε ας χρησιμοποιήσω ένα παράδειγμα που να έχει και τα δύο.

 

Ας πάρουμε δύο ημιτονοειδή σήματα 40 KHz και 30 KHz και ας τα πούμε X και Υ. Και τα δύο είναι μή ακουστά σήματα, από την στιγμή που είναι πολύ πιο πάνω από το πάνω όριο ακοής. Τα δύο αυτά σήματα τα στέλνουμε σε ένα κύκλωμα που κάνει δακτυλιοειδή διαμόρφωση (ring modulation). Στην δακτυλιοειδή διαμόρφωση δύο τέτοιων σημάτων, το αποτέλεσμά τους είναι ένα σήμα το οποίο περιέχει ταυτόχρονα δύο "συστατικά": ένα είναι το άθροισμα τους και άλλο ένα είναι η διαφορά τους.

 

Αρα έχουμε:

 

X + Y = 70 KHz (μη ακουστό σήμα)

X - Y = 10 KHz (ακουστό σήμα)

 

Βλέπουμε λοιπόν ότι υπάρχει περίπτωση 2 μη ακουστά σήματα, μέσω διαμόρφωσης (στην συγκεκριμένη περίπτωση είναι ουσιαστικά amplitude modulation), να παράγουν ένα ακουστό σήμα. Διάλεξα επίτηδες αυτά νούμερα Χ και Υ για να δείξω τι γίνεται σε περίπτωση που αυτά δεν υποστούν band-limiting. Σε ένα modular με εφαρμογή CV στην χροιά των ταλαντωτών μπορεί κάλλιστα να επιτευχθούν αυτές οι τιμές (30 και 40 KHz) και δεν υπόκεινται σε κανενός είδος περιορισμούς (αν εξαιρέσουμε φυσικά τα ηχεία).

 

Το πρόβλημα ανακύπτει αν αυτές οι δύο τιμές (ή οποιεδήποτε άλλες πάνω από Nyquist/2) παραχθούν ψηφιακά. Το καίριο ερώτημα είναι πρέπει ή δεν πρέπει να περιορισθούν ευθύς εξαρχής από γεννησιμιού τους μέσα στον κώδικά ή μπορούμε να τις αφήσουμε ανεξέλεγκτες να παράγουν οποιοδήποτε αποτέλεσμα και να επαφιόμαστε στο ότι θα φιλτραριστούν από το lowpass φίλτρο του μετατροπέα; Εάν δεν πρέπει να περιοριστούν γιατί φοβούμαστε μήπως χάσουμε κάποια πολύτιμη μουσικά πληροφορία, τότε είμαστε σίγουροι ότι τα αποτελέσματά τους (τα οποία είναι μέσα στο ακουστό εύρος) δεν παράγουν ηχητική σαβούρα (π.χ. aliasing);

 

Στο παράδειγμα που ανέφερα: Τι δουλειά έχει ένα ring modulated σήμα, ξεκάρφωτο στα 10 KHz? Θα μπορούσε να είναι σε διάφορα άλλα σημεία που είναι τελείως μη προβλέψιμα. Θα μπορούσε ακόμα να είναι σε πολλαπλά σημεία εάν τα αρχικά σήματα δεν ήταν απλές κυματομορφές. Θα μπορούσε να είναι ένα σύνθετο σήμα και όχι ένα απλό ημιτονοειδές σήμα. Εδώ ναι μεν έχουμε ένα σήμα στα 10 KHz αλλά το σήμα αυτό δεν μπορεί να διαχωριστεί από το σήμα στα 70 KHz παρά μόνο με ένα PLL κύκλωμα.

 

Είναι σημαντικό να μην ξεχνάμε το ακουστικό μας εύρος. Ότι και να παραχθεί, είτε απ' ευθείας από το εκάστοτε όργανο, είτε από σπόντα μέσω modulation, πρέπει τα αντικατοπτριζόμενα στοιχεία μέσα στο ακουστικό μας εύρος να μην είναι ηχητική σαβούρα και να είναι το κατά δύναμη προβλέψιμα. Δεν είμαι πολύ σίγουρος κατά πόσο είναι προβλέψιμα μιας και η σύνθεση που συνήθως παράγει τα πιο απρόβλεπτα αποτελέσματα είναι η FM μεταξύ πολύπλοκων κυματομορφών.

 

Στην περίπτωση που απλά έχουμε κάποια συνήχηση που παράγει (ή νομίζουμε ότι παράγει) κάποια τρίτα σήματα, φαντάζομαι ότι πάλι πρέπει να δούμε κατά πόσο είναι προβλέψιμα (ή έστω αρεστά). Δηλαδή να συνηχούν 2 σήματα, να παράγουν ένα καινούριο το οποίο είναι εκτός ακουστικών ορίων, και αυτό με την σειρά του να έχει κάποιο mirroring μέσα στο ακουστό εύρος το οποίο είναι επιθυμητό... Δεν ξέρω.. εξ άλλου μερικές φορές και το aliasing παράγει ενδιαφέροντα αποτελέσματα, άρα κρίνοντας το έτσι, γιατί να το κόψουμε;

 

Ποιά είναι η γνώμη σου;

 

...

 

Haryy θα ακούσω προσεκτικά τα δείγματα στα ηχεία (και όχι στο laptop) για να δώ μήπως και διακρίνω κάτι.

:)

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Γεια σου infectme247. Ευχαριστώ για τις παρατηρήσεις σου. Μήπως άκουσες και το τεστ στην 5η σελίδα με την σταθερή πηγή? Θα ήθελα την άποψή σου αν δεν το έχεις ήδη ακούσει.

 

Καλησπέρα Haryy. Είχα ακούσει και αυτά τα αρχεία όταν έγραφα το προηγούμενο ποστ, χωρίς να μπορώ να καταλάβω κάποια διαφορά. Η μόνη μου παρατήρηση είναι ότι ο ήχος μου ακουγόταν κάπως "κούφιος" και με πολύ αντήχηση, σε όλα τα αρχεία. Σίγουρα δεν θα ήταν ένα δείγμα ήχου πάνω στο οποίο θα ήθελα να κάνω critical listening, αν ήταν να εμπιστευτώ τα αυτιά μου.

Η αλήθεια είναι πάντως ότι ούτε έμπειρα αυτιά έχω, ούτε κανένα αξιόλογο σύστημα μόνιτορινγκ ή κάρτα ήχου, οπότε δεν θα μου φαινόταν περίεργο αν κάποιοι όντως ακούν διαφορές.

 

Πάντως, η άποψή μου παραμένει ότι το πείραμα αυτό είναι πολύ δύσκολο να γίνει σωστά (τουλάχιστον όπως ορίζω εγώ το "σωστά"), για διάφορους λόγους, μερικούς εκ των οποίων ανέφερα και στο προηγούμενο ποστ.

Ίσως αν είχα κάποια κάρτα ήχου με σοβαρούς converters και μια "πραγματικά αναλογική" πηγή ήχου (δηλαδή όχι προϊόν DAC) να δοκίμαζα κάτι αντίστοιχο, αλλά δυστυχώς...

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Thanks for listening!

 

 

Το συγκεκριμένο δείγμα χρησιμοποιήθηκε με αυτόν τον τρόπο γιατί έπρεπε να τηρεί 2 κανόνες:

α) Η πηγή έπρεπε να είναι σταθερή.

β) Αν ήταν μόνο ψηφιακό το σήμα θα είχα καταρχήν σοβαρή ένσταση εγώ για λόγους που ειπώθηκαν τουλάχιστον 2 φορές.

Ήθελα λοιπόν να είναι όσο πιο σύνθετο γινόταν. Με τον τρόπο αυτό οι χιλιάδες ανακλάσεις του χώρου και η διαφορές φάσεις μεταξύ των 2 ηχείων που "έπιανε" το μικρόφωνο, έκαναν το σήμα περισσότερο αναλογικό και σύνθετο κατά τη γνώμη μου αλλά ταυτόχρονα διατηρούσε και τον κανόνα της "σταθερής" πηγής.

Αυτά και πάλι ευχαριστώ για την άποψή σου.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Με τον τρόπο αυτό οι χιλιάδες ανακλάσεις του χώρου και η διαφορές φάσεις μεταξύ των 2 ηχείων που "έπιανε" το μικρόφωνο, έκαναν το σήμα περισσότερο αναλογικό και σύνθετο κατά τη γνώμη μου

 

Αυτό δεν το καταλαβαίνω... ακούμε με αναλογικό και όχι με ψηφιακό τρόπο, ανεξαρτήτως του τι είναι η πηγή. Και τι θα σήμαινε "περισσότερο αναλογικό"? Δεν υπάρχουν διαβαθμίσεις... ή είναι ή δεν είναι!  :-\

Fear no more the heat o' the sun

Nor the furious winter's rages

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Αυτό δεν το καταλαβαίνω... ακούμε με αναλογικό και όχι με ψηφιακό τρόπο, ανεξαρτήτως του τι είναι η πηγή. Και τι θα σήμαινε "περισσότερο αναλογικό"? Δεν υπάρχουν διαβαθμίσεις... ή είναι ή δεν είναι!  :-\

 

Μα δεν μιλάω γενικά για το πως ακούμε. Φυσικά και ακούμε αναλογικά.

 

Συγκεκριμένα λοιπόν μιλάω για το τι είδους είναι η πηγή του παραδείγματος. Και αυτό είναι ένα cd, δηλαδή ένα σήμα που έχει ήδη υποστεί ψηφιοποίηση άρα είναι μακριά από το ιδεατό, δηλαδή τον ζωντανό ήχο (αυτό είναι και το απόλυτα αναλογικό στην περίπτωσή μας).

Παρεμβάλλωντας λοιπόν την αλυσίδα μεγάφωνο-ζωντανός χώρος με ανακλάσεις-μικρόφωνο αλλοιώνουμε την απόλυτα ψηφιακή πηγή και την κάνουμε πιο "αναλογική" ώστε να φανούν περισσότερο οι όποιες διαφορές μεταξύ των αναλύσεων στο τεστ.

Αν απλά χρησιμοποιούσα ένα cd player να αναπαράγει την μουσική και ένα daw να ηχογραφεί απευθείας (χωρίς μικρόφωνο) στις 3 αναλύσεις, η προηγούμενη ψηφιοποίηση του cd νομίζω ότι θα στεκόταν εμπόδιο στην ανακάλυψη τυχόν διαφορών.

Δεν αποκλείω και το να φαίνονταν καθαρά όμως, αλλά δεν είναι αυτό το θέμα στην απορία σου.

Ελπίζω να έγινα κατανοητός με την έκφραση "περισσότερο αναλογικό". Ήθελα να "εξαφανίσω" εν μέρη τα artifacts της πρότερης ψηφιοποίησης και να προσθέσω στην πηγή του τεστ "αναλογική" κίνηση μεγαφώνου, "αναλογικές" ανακλάσεις χώρου και "αναλογική" κίνηση διαφράγματος μικροφώνου.

Ετσι προέκυψε το "περισσότερο αναλογικό". :)

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Καταλαβαίνω, όμως θα ήθελα να σχολιάσω αυτό (και πάλι παρακαλώ για όποιες διορθώσεις):

 

Αν απλά χρησιμοποιούσα ένα cd player να αναπαράγει την μουσική και ένα daw να ηχογραφεί απευθείας (χωρίς μικρόφωνο) στις 3 αναλύσεις, η προηγούμενη ψηφιοποίηση του cd νομίζω ότι θα στεκόταν εμπόδιο στην ανακάλυψη τυχόν διαφορών.

 

Αυτό θα αποτελούσε εμπόδιο μόνο αν η ψηφιοποίηση είχε κάποια σοβαρά σφάλματα ή αν ήταν χαμηλής ποιότητας (πχ. αν ήταν σε ΑΜ radio quality), κι αυτό μόνο γιατί το προς σύγκριση αντικείμενο θα είχε πολύ περιορισμένο φάσμα πληροφοριών ως προς την ανθρώπινη ακοή. Όμως, από τη στιγμή που μιλάμε πχ. για ένα cd πιστεύω πως δεν τίθεται τέτοιο θέμα. Και αν κάποιος είχε αμφιβολία για την ποιότητα της απόδοσης ενός cd (που δεν θα μπορούσα να καταλάβω προσωπικά το γιατί), θα μπορούσε να καταγράψει ψηφιακά την πληροφορία σε μια υπερυψηλή ποιότητα, όπως τα 192, και μετά να συγκρίνει το πώς αυτή συλλαμβάνεται πχ. από ένα ακριβό μικρόφωνο αναφοράς μόλις γίνει πάλι ηχητικό κύμα.

Fear no more the heat o' the sun

Nor the furious winter's rages

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Καταλαβαίνω, όμως θα ήθελα να σχολιάσω αυτό (και πάλι παρακαλώ για όποιες διορθώσεις):

 

Αυτό θα αποτελούσε εμπόδιο μόνο αν η ψηφιοποίηση είχε κάποια σοβαρά σφάλματα ή αν ήταν χαμηλής ποιότητας (πχ. αν ήταν σε ΑΜ radio quality), κι αυτό μόνο γιατί το προς σύγκριση αντικείμενο θα είχε πολύ περιορισμένο φάσμα πληροφοριών ως προς την ανθρώπινη ακοή. Όμως, από τη στιγμή που μιλάμε πχ. για ένα cd πιστεύω πως δεν τίθεται τέτοιο θέμα. Και αν κάποιος είχε αμφιβολία για την ποιότητα της απόδοσης ενός cd (που δεν θα μπορούσα να καταλάβω προσωπικά το γιατί), θα μπορούσε να καταγράψει ψηφιακά την πληροφορία σε μια υπερυψηλή ποιότητα, όπως τα 192, και μετά να συγκρίνει το πώς αυτή συλλαμβάνεται πχ. από ένα ακριβό μικρόφωνο αναφοράς μόλις γίνει πάλι ηχητικό κύμα.

 

ένα ψηφιακό σήμα είναι φασματικά περιορισμένο από τη συχνότητα δειγματοληψίας.

 

το να κάνω δειγματοληψία στα 192 σε κάτι που έχει υποστεί δειγματοληψία στα 44.1 είναι σα να πάρω ένα τσουβάλι με ρεβίθια και φακές, να το περάσω από ένα κόσκινο που κρατάει τα ρεβίθια (και αφήνει τις φακές) και μετά να πάρω τα ρεβίθια και να ψάχνω για άμμο!

 

"[...] the stupid are cocksure while the intelligent are full of doubt."

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Για εμένα η ηχητική απόδοση ενός cd θα υπερκάλυπτε τις απαιτήσεις, αφού όπως είπα προηγουμένως α. τα ΤΥΧΟΝ σφάλματα ψηφιοποίησής του είναι ιδιαίτερα έως εντελώς ανεπαίσθητα στην ανθρώπινη ακοή, β. η απόδοσή του περιέχει όλη την πληροφορία που δύναται αυτή να συλλάβει, κι έτσι δεν θα υπάρχει masking πολύτιμων ηχητικών δεδομένων. Για περισσότερα, τα προηγούμενα ποστς τα περιγράφουν πολύ καλύτερα από αυτά που θα έγραφα εγώ.

 

Δεύτερον, ακόμη και για τους σκεπτικιστές πρότεινα παραπάνω το αρχικό θέμα-καρμπόν να είχε καταγραφεί στα 192 κι όχι στα 44 όπως γράφεις (βασικά θα μπορούσα να κάνω quote αυτούσιο το προηγούμενό μου ποστ σαν απάντηση).

Fear no more the heat o' the sun

Nor the furious winter's rages

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

@skantzos

Ακριβώς. :)

 

Ένα άλλο παράδειγμα. Κατά την διάρκεια των τεστ έκανα κάτι πολύ απλό: "Χτυπούσα" τα δάχτυλά μου στο μικρόφωνο (κατά το αγγλιστί snap my fingers) και επιτόπου άλλαζα το sample rate από τα 44.1 στα 192 και ταυτόχρονα άκουγα από τα ακουστικά. Στα 192, κυριολεκτικά τα ακουστικά εξαφανίζονταν και ήταν σαν μην τα φορούσα.

Αν όμως ηχογραφούσα στα 44.1 και έκανα το test loop στις 3 δειγματοληψίες υπήρχε ποτέ περίπτωση να ξανακούσω αυτό το πράγμα?

Γιαυτό εξαρχής χρησιμοποίησα ζωντανές πηγές.

Στο θέμα του δεύτερου τεστ λοιπόν,η πολυπλοκότητα των ανακλάσεων και η κίνηση του μεγαφώνου και ακολούθως του μικροφώνου δίνει εκ νέου "φυσική" ζωντάνια (αν και πιο low-fi σε σχέση με το αρχικό) σε ένα ψηφιακό ηχογράφημα.

Αυτό για να αποκτήσουν ενδιαφέρον οι ακόλουθες δειγματοληψίες όχι για να το κυκλοφορήσουμε σε ..βινύλιο :)

 

Όσο για το δείγμα σε 192 και εγώ έχω πει ότι θα το δεχόμουν και θα το έκανα αλλά δεν έχω 2 daw με τέτοια ανάλυση.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργήστε λογαριασμό

Γραφτείτε στην παρέα μας. Είναι εύκολο!

Δημιουργία λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Σύνδεση

×
×
  • Δημοσιεύστε κάτι...

Τα cookies

Τοποθετήθηκαν cookies στην συσκευή σας για να είναι πιο εύκολη η περιήγηση στην σελίδα. Μπορείτε να τα ρυθμίσετε, διαφορετικά θεωρούμε πως είναι OK να συνεχίσετε. Πολιτική απορρήτου