|
GİRİŞ
İşaret işleme, Telekomünikasyon
Mühendisliği alanında yer alan bir araştırma ve uygulama
dalıdır. “İşaret” sözcüğü, bir sistemin davranışına ya
da durumuna ilişkin bilgi taşıyan büyüklüklere verilen
addır ve “sinyal” sözcüğü ile eş anlamlı olarak
kullanılmaktadır (Kayran, 2004:2). Bu kavram
çerçevesinde yazı, resim gibi bileşenler (kavramlar)
görsel işaretler; müzik ve konuşma gibi bileşenler de
ses işaretleri olarak nitelendirilebilir. Görüntü ve ses
işleme, işaret işlemenin özelleşmiş iki alt konusunu
oluşturur.
Çalışmanın konusu, bir müzik eserinin
melodik bilgisinin, işaret işleme metodları kullanılarak
bilgisayar tarafından elde edilmesidir. Bunun için
öncelikle ele alınan eserdeki notaların tanımlanması
(diğer müzikal öğelerden ayırt edilebilecek duruma
getirilmesi), sonra da bu notaların tanınması
(özelliklerinin belirlenmesi) gerekmektedir. Çalışma iki
ayrı başlık altında sunulacaktır: İlk bölüm görüntü
işleme teknikleri kullanılarak, nota kağıdına aktarılmış
bir müzik eserinin; ikinci bölüm ise ses işleme
teknikleri kullanılarak ses formatındaki bir müzik
dosyasının müzikal bilgilerine ulaşılması için gerekli
yöntemleri içermektedir.
YÖNTEMLER VE UYGULAMA
1. Görüntü İşleme Tekniği ile Nota Kağıdından Nota
Analizi
Önbilgi
Temel amaç, sayısal formatta kaydedilmiş bir nota kağıdı görüntüsündeki
notaların konumlarının ve özelliklerinin (ton ve vuruş
-uzunluk- değerlerinin) belirlenerek bu bilginin
matematiksel yapıda ve toplu bir biçimde ifade
edilmesidir. Eser hakkında özet niteliğindeki bu bilgi
kullanılarak parça ile ilgili istatistiksel bilgiler
derlenebilmekte ve melodi, bilgisayar tarafından
otomatik olarak çaldırılabilmektedir.
Bahsedilen tüm işlemler bilgisayarda
mühendislik hesaplamaları için geliştirilmiş özel bir
programlama yazılımı olan MATLAB üzerinde
gerçekleştirilmektedir. Bu sebeple, kullanılan yöntemin
anlaşılmasını kolaylaştırmak için bu aşamada kısaca
sayısal görüntü biçimi konusunda bilgi sunmak uygun
olur.
Bilgisayar gibi elektronik ortam cihazları
tarafından tanımlanabilen görüntü dosyalarına “sayısal
görüntü” adı verilir. Sayısal bir görüntü, “piksel” adı
verilen ve her biri tek bir renk tonunu barındıran küçük
elemanlardan meydana gelir. Pikseller, koordinat
düzleminde yatay ve düşey şekilde sıralanarak sayısal
görüntüyü oluşturur. Bilgisayar ekranındaki bir resim
fazla yakınlaştırıldığında (büyütüldüğünde), resmi
oluşturan pikseller, küçük kareler şeklinde görülebilir.
Bir nota görüntüsü ve bu görüntünün bir kısmının
büyütülmüş durumu Şekil 1’de
gösterilmektedir.
Resim yakınlaştırıldığında görülebilen piksellerin resim dosyası
üzerindeki konumları birer satır ve sütun numarası ile
tanımlanabilir. Matematiksel dilde satır ve sütunlardan
oluşmuş böyle bir yapıya “matris” adı verilmektedir (Digital
Image Processing, 2002:55).
Şekil
1.
Dörtlük bir nota ve görüntü
büyütüldüğünde ortaya çıkan piksel yerleşimleri
Her bir pikselin taşıdığı renk tonu,
elektronik cihaz üreticileri tarafından ortaklaşa
kararlaştırılmış bir sayı kodu ile belirtilir. Yalnızca
siyah ve beyaz tonlardan oluşan bir görüntüde siyah ton
“0”, beyaz ton ise “1” rakamı ile gösterilir. Bu tip
görüntülere yalnızca iki ton barındırdıklarından, “ikili
görüntü” adı verilmektedir. Nota kağıdına aktarılmış bir
müzik eserinde, yazım renginin bir önemi olmadığından,
çalışmada ikili formattaki nota kağıdı görüntüleri
kullanılmıştır.
Notaların Belirlenmesi
Görüntü işleme açısından notanın tonunun ve uzunluğunun belirlenmesi
işlemi sırasıyla, notanın porte üzerindeki yerinin ve
nota yuvarlağının dolu olup olmadığı, yanında uzatma
noktası veya kuyruğu bulunup bulunmadığı gibi bilgilerin
edinilmesine karşılık gelmektedir. İşlemin adımları,
örnek olarak Şekil 2 üzerinde gerçeklenecektir.

Şekil
2.
Örnek nota kağıdı görüntüsü
Böyle bir görüntü (Şekil
2) müzik eğitimi almış kişiler için bir anlam ifade etse
de, bilgisayar için 0 ve 1’lerden oluşmuş piksellerden (matris
hücrelerinden) başka bir anlam taşımamaktadır. “Nota”
kavramını bilgisayara anlatmak mümkün olmadığından,
yalnızca renk tonundaki zıtlıklardan ve notasyon ile
nota kağıdı oluşturma geleneğinin sağladığı olanaklardan
yararlanarak nota yerleri bulunmaya çalışılacaktır.
Nota yerlerinin (koordinatlarının) tanımlanabilmesi
için öncelikle porte çizgilerinin bilgisayar tarafından
öğrenilmesi gereklidir. Bu amaçla görüntü tepeden aşağı,
satır satır taranır. Bir satır boyunca siyah ton (piksel)
yoğunluğunun önceden tanımlı bir eşik değerden daha
yüksek olması durumunda, bu satır bir porte çizgisi
olduğu yönünde bir etiket ile belirlenir. Nota
kağıtlarıyla yapılan denemeler ile bu yoğunluk sınırının,
tüm satırın %70’i olarak alınmasının uygun olduğu
görülmüştür. Bu işlem sonucunda hem işaretli (etiketli)
satırların ana resmin kaçıncı satırları olduğunu
belirten bir çıktı, hem de yalnızca portenin
görülebildiği bir resim elde edilebilir (Şekil 3).

Şekil
3.
Şekil 2’de portenin belirlenmesi ile elde
edilen görüntü
Gerçekte bir nota
kağıdında yalnızca tek bir portenin bulunmayacağı
açıktır. Böyle bir durumda görüntü baştan aşağı
taranarak her beş porte çizgisinden sonra yeni bir
portenin geleceği varsayılabilir ve bu sayede ilerideki
adımlar, her bir porte parçası üzerinde tekrarlanabilir.
Aranan bilgi, yalnızca
notalar tarafından taşınmaktadır. Dolayısıyla notaların
tanımlanabilirliğini artırmak üzere görüntüdeki diğer
elemanlar silinebilir. Sayısal bir görüntü yalnızca
rakamlar içeren bir matris yapısında olduğundan, bu
matrisin hücreleri arasında toplama, çıkarma gibi
matematiksel ve ‘VE’, ‘VEYA’, ‘DEĞİL’ gibi mantıksal
işlemler yürütülebilir. Örneğin, orijinal resim (Şekil
2) ile yalnızca porteyi içeren resmin (Şekil 3)
mantıksal olarak karşılaştırılması sonucu, portenin
görüntüden silindiği resim elde edilmektedir (Şekil 4).

Şekil 4.
Portesi silinmiş nota kağıdı görüntüsü
Aynı yöntem, elde edilen
bu görüntüdeki ölçü çizgileri ve nota çizgileri gibi
düşey çizgileri elemek için de kullanılır. Bu kez, yan
yana sıralanmış her bir sütun üzerinde siyah piksel
yoğunluğunun %85’i geçmesi durumunda, sütun silinmek
üzere markalanır. Sonuçta oluşan durum Şekil 5’teki
gibidir.

Şekil
5.
Düşey çizgilerin de elenmesi sonucu
oluşan görüntü
Belirtilen koşul
sağlandığından, sol anahtarının da büyük bir kısmı
görüntüden silinmiştir. Ancak anahtar ve hemen yanındaki
ölçü işareti bu işlem sonucu tamamıyla yok edilememiştir
(Şekil 5). Nota kağıdındaki her portede bu elemanların
bulunduğu düşünülecek olursa, bunların göz ardı edilerek
yalnızca notaların resimde görüneceği bir sol-sınır (sütun)
bulunabilir. Çeşitli nota kağıtlarıyla yapılan denemeler
notaların, resmin tüm sütunlarına oranla %8’inden önce
başlamadığını, dolayısıyla görüntünün buraya kadar olan
kısmının ihmal edilebileceğini göstermiştir. Böyle bir
yöntem izlendiğinde, yalnızca ilgilenilen elemanların (nota,
nokta ve kuyrukların) bulunduğu Şekil 6 elde
edilmektedir.

Şekil
6.
Yalnızca ilgilenilen elemanların
bulunduğu görüntü biçimi
Bu aşamadan sonra istenen,
her nota yuvarlağının tek tek konumlarının bulunmasıdır.
Ancak bunun için, notayı ortadan bölen (porte çizgisinin
çıkarılmasıyla oluşan) beyaz çizgilerin ve notalara ait
nokta ve kuyrukların göz ardı edilmesi gerekmektedir. Bu
amaçla, elde edilen şekil üzerine çeşitli morfolojik
yöntemler uygulanır.
Sayısal görüntü işlemede morfolojik yöntemler, söz
konusu resmin genel yapısını bozmadan şekilsel bir takım
düzeltmeler yapmak üzere kullanılan genişletme, daraltma,
budama gibi işlemlerden oluşur (Digital Image
Processing, 2002: 519). Morfolojik
düzeltmeler sonucunda, Şekil 7’de gösterildiği gibi nota
yerlerinin belirlenmesi için istenen görüntü düzenine
ulaşılır.

Şekil
7.
Morfolojik düzeltmeler sonucu ulaşılan
nota görüntüsü
Görüldüğü gibi Şekil
7’deki resimde her bir nota yuvarlağı aslında onlarca
pikselin bir araya gelmesiyle oluşmaktadır. Bu
piksellerin koordinatlarının ortalama değerleri alınarak,
her bağımsız nota yuvarlağının tek bir piksel koordinatı,
başka bir deyişle (satır,sütun) ikilisi ile belirlenmesi
sağlanır. Bu (satır,sütun) ikilileri bir tablo şeklinde
kaydedilir.
Notaların ton bilgisine
ulaşmak amacıyla, her bir nota için kaydedilen piksel
koordinatı, porte çizgilerinin daha önceden çıkartılmış
bulunan koordinatlarıyla karşılaştırılır ve notanın,
hangi çizginin üzerinde ya da hangilerinin arasında
bulunduğu tespit edilir. Böylece elde edilen ton bilgisi,
matematiksel bir kod ile hazırlanan tabloya yeni bir
sütun oluşturacak biçimde eklenir.
Nota Uzunluklarının Belirlenmesi
Notaların uzunluk değeri
birçok eleman tarafından ortaklaşa belirlendiğinden,
doğru bilgiyi tek bir aşamada elde etmek olası değildir.
Bu nedenle önce, nota yuvarlaklarının içinin dolu olup
olmadığına bakılır. Her bir notanın koordinatını
belirleyen pikselin çevresindeki 3x3 piksellik bölgede
siyah yoğunluğu %50’nin altında kalıyor ise, bu nota içi
boş (2 vuruşluk) bir nota olarak değerlendirilir. Aksi
takdirde, notanın 1 vuruşluk ya da daha düşük değerde (uzunlukta)
bir nota olduğu belirlenir.
Bundan sonraki aşamalar
ise notanın yanında nokta ve sapında kuyruk olup
olmadığının araştırılmasını kapsar. Nokta araştırması
için, öncelikle notanın görüntüsünün en sağ uç noktası (pikseli)
işaretlenir. Bu noktadan sağa doğru küçük bir alanda (denemeler
5x4’lük bir alanın yeterli büyüklükte olduğunu
göstermektedir) noktayı belirten bir siyah piksel
bulunup bulunmadığı araştırılır. Eğer notanın yanında
nokta olduğu tespit edilirse, notanın önceden
belirlenmiş uzunluk değeri 1.5 katına çıkarılır.
Nota sapında kuyruk
bulunup bulunmadığıyla ilgili araştırma da benzer
biçimde yapılabilir. Notanın çiziliş biçimine uygun
olarak, sağ-üst veya sol-alt yakınlığında bir siyah
piksel varlığı, nota kuyruğunu belirtecektir. Bu durumda
notanın önceden belirlenmiş uzunluğu yarıya düşürülür.
Notanın hem kuyruğu, hem de noktası olma durumunda
öncelikle kuyruk tarafından belirlenen süre düzeltmesi
değerlendirilir.
Elde Edilen Verilerin Kullanılması
Tüm bu işlemler sonucunda
notanın ton ve uzunluk (vuruş) değerleri belirlenmiş
olur. Bu bilgiler son halini alan bir tabloda saklanır
(Tablo1). Artık yalnızca matematiksel ifadeden oluşmuş
bu tabloyu kullanılarak eser hakkında nota analizi
yapmak olanaklıdır. Örneğin, tonlarına göre nota
dağılımı ya da eserde daha çok kaç vuruşluk notaların
yer aldığı bilgilerine kolaylıkla ulaşılabilir. Ayrıca,
yine bu tablodaki bilgiler kullanılarak nota analizi
yapılan eserin bilgisayar tarafından çaldırılması da
sağlanabilir.
Tablo
.
Örnek parça için nota ton ve vuruş
değerlerini içeren tablo
|
Sıra |
Nota Ton |
Nota Vuruş |
|
1 |
Mi |
1 |
|
2 |
Mi |
1 |
|
3 |
Fa |
1 |
|
... |
... |
... |
|
13 |
Mi |
1.5 |
|
14 |
Re |
0.5 |
|
15 |
Re |
2 |
2. Ses İşleme Tekniği ile Müzik
Dosyasından Nota Analizi
Önbilgi
Bu bölümde ses işleme tekniği
kullanılarak, dinlenebilir formattaki bir müzik
dosyasında seslendirilen eserin nota analizi için bir
yöntem sunulacaktır. Burada öncelikle, sesin dalga
yapısının işaret işleme açısından önem taşıyan kısmı ile
ilgili kısaca bilgi verilecektir.
Bilindiği gibi her ses,
genliği sesin şiddeti, frekansı ise sesin tonu ile
belirlenen bir dalga biçimi oluşturur. Bilgisayar
tarafından oluşturulan tek frekanslı sesler, tek bir
sinüs dalgası biçiminde ifade edilebilir. Doğal sesler (insan
sesi, enstrüman sesi gibi) ise bundan çok daha karmaşık
yapıdadır ve geniş bir frekans bandına yayılmıştır.
Ancak karmaşık yapılı olsalar dahi tüm sesler, belirli
frekanslara sahip sinüsoidlerin (sinüs benzeri dalga
biçimlerinin) süperpozisyonu (belirli ağırlıklarla
çarpılarak toplanmış kombinasyonları) biçiminde ifade
edilebilir (Signals and Systems, 2003: 195).
Bir ses işaretini oluşturan frekansların görülmesi için
bu işaretin frekans spektrumu incelenebilir. Frekans
spektrumu kabaca, işaret içinde hangi frekanslardan ne
ağırlıkta bulunduğunu gösteren bir grafiktir.
Dolayısıyla eğer enstrüman seslerinde olduğu gibi
çalınan notada baskın bir frekans mevcut ise bu, frekans
spektrumunda kendini yüksek ağırlıklı (genlikli) bir
tepecik olarak gösterir.
Her nota, belirli bir frekans bandı içerisinde anlam
taşır ve bu frekans bandının orta noktasındaki değer, o
notanın merkez frekansı olarak adlandırılır. Frekans
bandlarının notalarla ilişkilendirilmesi ise farklı
biçimlerde olabilmektedir. Evrensel olarak kabul edilmiş
bulunan “Tampere Sistem”de her ses tonu bir öncekini,
öncekinin frekansının 21/12 = 1.059 katı
kadar bir frekansla takip etmektedir. Bu şekilde
sıralanan 12 ses tonu bir oktav oluşturur, dolayısıyla
her oktavın başlangıç tonu, bir önceki oktavın başlangıç
tonunun tam iki katı frekansındadır. Temel olarak insan
kulağının algılayabileceği seviyede en düşük frekanslı
(en kalın) ton, 55.00 Hz’lik temel frekansa sahip A1
notasıdır. Oktav değişimleri ise, A2 = 110.00 Hz, A3 =
220.00 Hz örneğinde olduğu üzere, nota yanındaki rakamın
değişimi ile sembolize edilir.
Notaların Belirlenmesi
Birinci bölümde olduğu gibi bu bölümde de, ilgilenilen
ses dosyasının melodik özelliklerinin belirlenebilmesi
için nota tonlarının ve uzunluklarının ayrı ayrı
belirlenmesi gerekmektedir. Nota tonları, her bir
notanın frekans bilgisi kullanılarak, nota uzunlukları
ise bir zaman ölçeğinde her bir notanın bağıl (birbirlerine
oranla) uzunlukları belirlenerek çıkarılacaktır.
Asıl inceleme konusu olan nota özelliklerinin
tanımlanabilmesi için, öncelikle ses dosyasının, her
biri tek bir notayı içeren parçalara bölünmesi
gerekmektedir. Bu da, notaların ses dosyasında başlangıç
ve bitiş noktalarının (anlarının) belirlenmesi
problemini beraberinde getirmektedir. Bu işleme kısaca,
“başlangıç yeri tespiti” adı verilir (On the computer
recognition of solo piano music: 2). Bu tespit
çalışmanın en önemli aşamasını teşkil etmektedir. Bu
aşama doğru yapıldığı takdirde bundan sonraki tüm
işlemlerin minimum (%5’in altında) hata payı ile
yürütülebildiği görülmüştür.
Çalışma, Şekil 8’de zaman grafiği verilen ses dosyası
üzerinde aktarılacaktır. Bu dosyada, bir çıkış-iniş Do
Majör dizisi seslendirilmektedir.

Şekil
8.
Ses işleme tekniği için örnek ses
dosyasının dalga biçimi
Yüksek genlikler (tepecikler) ile belirlenen nota
başlangıç anları yalnızca grafiğin incelenmesi ile insan
gözü tarafından kolaylıkla tespit edilebilmektedir.
Örnek olarak sunulan grafikte de (Şekil 8) her bir
notanın başlangıcı ani yükselen genlik seviyesi ile
ayırt edilebilmekte ve nota dalga biçiminin mutlak
genliğinin (başka bir deyişle salınım şiddetinin), diğer
notanın başlangıcına kadar düşmekte olduğu
gözlenmektedir.
Ancak aynı tespitin
bilgisayar tarafından otomatik olarak yapılması
istendiğinde, durum aynı derecede basit değildir.
Grafiğe yakından bakılacak olursa belirli bir nota
içinde genlik dağılımının düzgün azalan biçimde olmadığı,
tek bir notanın dalga biçiminde dahi ani sıçrama
noktalarının bulunduğu görülecektir. Bilgisayarın bu
değerleri bir nota başlangıcı olarak adlandırmaması için
çeşitli istatistiksel tanımlamaların ve bazı fiziksel
kıstasların programa “öğretilmesi” gerekmektedir. Söz
konusu problemin çözümü için kullanılan algoritma
aşağıdaki gibidir:
·
Öncelikle, mutlak
işaretin (tamamı pozitif değerlerden oluşan işaretin)
ortalama değeri ve standart sapması hesaplanır. Ortalama,
işaretin en olası genlik değerini belirtirken standart
sapma, değerlerin ortalamadan ne ölçüde saptıkları
konusunda bir referans bilgi oluşturmaktadır.
·
Ardından, işaretin
dalga biçimi üzerinde, ortalamadan en az dört standart
sapma kadar farklılık gösteren noktalar bulunup
işaretlenir. Bu durum, grafikte yalnızca ani genlik
sıçramalarının olduğu bölgelerin (tepe bölgelerinin –
nota başlangıç bölgelerinin) ön plana çıkarılmasına
yardımcı olmaktadır. Böylece işaretlenmiş noktalardan
oluşan bir grafik izlenebilir (Şekil 9).

Şekil 9.
Ortalamadan dört standart sapma kadar
farklı olan tepe değerleri
·
Bu koşulu sağlayan
noktalar tepe noktalarının yeri konusunda oldukça iyi
bir yaklaşım sergilemekle birlikte, her bir tepe (nota)
için tek bir işaretlenmiş nokta bulmak mümkün
olmamaktadır. Bu durumda bilgisayarın hesaplamalarına
fiziksel gerçeklenebilirlik ile ilgili bir kısıt
getirmek gereklidir: “Çalınan iki notanın başlangıçları
arasındaki sürenin, saniyenin üçte birinden az olması
fiziksel olarak gerçekleşmesi zor bir durumdur.” İşte bu
kısıt koşul algoritmaya dahil edildiğinde ve koşulu
sağlamayan noktaların işaretlerinin kaldırılması
istendiğinde, her bir nota başlangıcı için tam olarak
bir tepe noktası işaretlenmiş olmaktadır (Şekil 10).
Ayrıca, parçanın bitişini sembolize edecek şekilde en
sona da bir işaret yerleştirilmelidir:

Şekil 10.
Her nota başlangıcı için tek işaretlenmiş
nokta içeren grafik
Böylece notaların
başlangıç noktaları hatasız olarak işaretlenmiştir. Her
bir notanın birbirini aralıksız (durak olmaksızın) takip
ettiği göz önüne alınacak olursa, bir nota uzunluğunun
işaretli bir noktadan sıradakine kadar olduğu
varsayılabilir. Böylece sıra, notaların hangi tonda
olduklarını belirlemeye gelmiştir.
Bu işlem için, işaretli iki nokta arasındaki bölgede
bulunan dalga biçiminin frekans spektrumu incelenir.
Burada notanın merkez frekansı çok belirgin biçimde elde
edilememekle birlikte, çeşitli yaklaşımlar kullanılarak
ilgilenilen aralıkta hangi frekansın (ses tonunun)
baskın olarak bulunduğu belirlenebilmektedir. Her bir
nota için belirlenen bu değerler bir tabloya sırasıyla
kaydedilir.
Nota Uzunluklarının Belirlenmesi
Nota başlangıç yerleri ve
notaların birbirlerini aralıksız takip ettiği bilgisini
kullanarak, iki nota başlangıcı arasındaki zaman
farkından, her bir notanın ne kadar süre ile (kaç saniye)
çalındığını belirlemek olanaklıdır. Ancak, müziği okuyan
kişi açısından önemli olan notanın süre cinsinden değil,
vuruş cinsinden uzunluğudur.
Nota uzunluklarının (vuruşlarının) belirlenmesi
konusundaki en önemli problem, eserdeki nota tipleri ile
ilgili sisteme bir ön bilgi verilmemiş olmasıdır. Aynı
müzik eserinde çalınan benzer notaların uzunlukları,
kullanılan enstrümana, seçilen tempoya ve hatta çalan
kişinin tarzına bağlı olarak değişkenlik
gösterebilmektedir. Üstelik, çalış esnasında aynı vuruşa
sahip iki notanın da bire bir eşit sürelerle çalınması
olanaklı değildir.
Bu durum, yine birtakım varsayımlar yaparak sisteme
bazı kısıtlamalar getirmeyi gerektirmektedir. Bu amaçla
öncelikle, ilgilenilen eserin yalnızca 8’lik, 4’lük,
2’lik notalar ile bunların tek kuyruklu ve tek noktalı
versiyonlarından oluştuğu varsayılacaktır (Varsayım,
sonraki işlemlerin basitleştirilmesi amacıyla
yapılmaktadır, teoride tüm vuruş çeşitlerinin kapsanması
söz konusudur). Ayrıca, nota sürelerinden vuruş
sayılarına sağlıklı bir dönüşüm yapabilmek amacıyla, bir
referans nota uzunluğu seçilmelidir. Böylece diğer
notaların vuruşları, bu referans notanın vuruşu ile
karşılaştırılarak belirlenebilir. Yine basitlik amacıyla,
bu referans nota, parçada en çok kullanılmış nota olacak
biçimde seçilebilir.
Nota vuruşlarının tespiti için kullanılan algoritma da
şu adımlardan oluşmaktadır:
·
Öncelikle, tüm notalar
süre bakımından kısadan uzuna olacak şekilde sıralanır.
Daha önce belirtildiği gibi, nota başlangıçlarının kesin
tespit edilememesi olasılığı ve müzisyenin benzer
vuruşlu notaları tam olarak eşit süreler ile
çalamayacağı gerçeğinden hareketle, notaların süre
bakımından gruplandırılması gerekmektedir.
·
Sıraya dizilmiş bu
notalara bakıldığında, vuruş bakımından farklı, ardışıl
iki notanın arasındaki süre farkının en az 1.5 olması
gerektiği açıktır. Bu iki orandan başka bir olasılık söz
konusu olmadığından, uzunluk bakımından birbirlerine
oranı 1.25’in altında olan ardışıl her iki nota, aynı
grupta olacak şekilde sınıflandırılabilir. Bir sonraki
aşamada bu grubun en düşük süreli elemanı referans
olarak alınır ve işlemlere devam edilerek gruplar
oluşturulur.
·
Verilen örnekte,
parçada en çok 1 vuruşluk (dörtlük) notalar
bulunmaktadır. Bu durumda dörtlük notalar çok yüksek
olasılıkla uzunluklarına göre sıralanmış dizinin
ortasında yer alacaktır. Dolayısıyla, dizinin tam
ortasında yer alan nota, referans nota olarak
belirlenmektedir. Varsa, önceden gruplanmış diğer
notalar da bu referans büyüklüğe oranlanarak 8’lik
notalar, 2’lik notalar, vb. şekilde etiketlendirilir.
Belirlenen nota uzunluklarının parçanın temposuna uygun
olmadığı düşünülecek olursa sonradan tüm notaların vuruş
sayısı belirli bir tamsayı ile çarpılıp bölünerek
düzenleme yapılabilir.
Böylece elde edilen notaların vuruş bilgisi, nota
tonlarının bulunduğu tablonun yanına eklenir. Son halini
alan bu tablo, eserdeki tüm notaların, dolayısıyla
eserin kendisinin bilgisayar için ileri düzey
hesaplamalara uygun bir özet bilgisini taşımaktadır.
Örnek parça için çıkartılan tablo, Tablo2’de
sunulmaktadır:
Tablo 2.
Örnek parça için nota ton ve vuruş
bilgisini içeren tablo
|
Sıra |
1 |
2 |
3 |
... |
7 |
8 |
9 |
... |
15 |
16 |
17 |
|
Nota Ton |
C4 |
D4 |
E4 |
... |
B5 |
C5 |
B5 |
... |
C4 |
B4 |
C4 |
|
Nota Vuruş |
1 |
1 |
1 |
... |
1 |
1 |
1 |
... |
1 |
1 |
3 |
Elde Edilen Verilerin Kullanılması
Görüntü işleme ile nota
analizinde elde edilen sonuç tablosu, notaların
bilgisayar yardımıyla seslendirilmesi için
kullanılmıştır. Ses işleme tekniği ile elde edilen
sonuçlar da bilgisayar tarafından otomatik olarak eserin
nota kağıdının hazırlanması için kullanılabilir. Önceden
hazırlanmış nota, porte, anahtar gibi müzik
elemanlarının resim formatındaki şablonları, tablodan
edinilen bilgiler doğrultusunda bir araya getirilerek
nota kağıdının oluşturulması sağlanabilmektedir. Örnek
ses dosyası için hazırlanan programın çalıştırılmasıyla,
Şekil 11’deki görüntü oluşturulmuştur.

Şekil 11.
Örnek ses dosyası için oluşturulan nota
kağıdı görüntüsü
Günümüzde internet
bağlantı ve veri aktarım hızlarının giderek artmasına
karşın, bilgisayarlar arasında büyük boyutlu müzik
dosyalarının aktarımı sırasında halen uzun süreler
beklemek gerekebilmektedir. Elde edilen sonuçlar, eseri
dinlemek yerine yalnızca hakkında genel bir fikir
edinmek isteyen bilgisayar kullanıcıları için de oldukça
kullanışlı olabilecektir: Notalar hakkındaki özet bilgi,
eserin ses formatındaki bütününe oranla çok daha az yer
kaplamakta ve aktarımı çok daha hızlı biçimde
yapılabilmektedir. Alıcı kişi, bu bilgiyi kullanarak
kendi bilgisayarında eserin otomatik olarak
seslendirilmesini sağlayabilir ve bu sayede melodiyi
dinleyebilir.
Bu amaçla düşünülmüş iki
farklı yöntem bulunmaktadır: Birincisi, ses sentezi ile,
seslerin tamamıyla bilgisayar tarafından otomatik ve
anlık olarak üretilmelerini sağlamaktır. Bu yöntemin en
basit hali, görüntü işleme ile nota analizi bölümünün
sonunda kısaca belirtilen, her tonun birer sinüs dalgası
ile sembolize edilerek çaldırılması durumudur. Ancak
günümüzde çok daha gelişmiş ses sentezi teknikleriyle,
birçok müzik enstrümanının sesi yüksek başarıyla taklit
edilebilmektedir.
Daha az bilişsel emek
gerektiren bir başka yöntem ise, dinlenilmesi istenen
enstrüman seslerinden kayıt alarak her nota (ton) için
ses örnekleri toplamaktır. Bu ses örnekleri, tabloda
yazılı olan bilgiler kullanılarak art arda eklenebilir
ve böylece melodi, istenen enstrüman ya da enstrüman
kombinasyonu ile dinlenebilir.
Proje çalışması sırasında
ikinci yöntemi test etmek üzere, İTÜ Türk Musikîsi
Devlet Konservatuvarı’nda çeşitli enstrümanlardan ses (nota)
örnekleri toplanmıştır. Bir veritabanına kaydedilen bu
ses örnekleri, farklı nota tabloları ile denenmiş ve
yöntemin -eser hakkında genel bir bilgi edinmeye yetecek
düzeyde- oldukça başarılı biçimde çalıştığı gözlenmiştir.
SONUÇLAR VE TARTIŞMA
1. Bölümün Sonuçları:
1a.
Çalışmada, nota kağıdının görüntü işleme tekniği ile
analizi için işlemsel açıdan basit bir yöntem
önerilmektedir. MATLAB dili kullanılarak hazırlanan
programda W.A. Mozart’ın “9. Senfoni” ve J.S. Bach’ın
“Minuet in G” eserlerinden kısa parçalar denenmiş ve
nota tanımada %95’lere varan başarı elde edilmiştir.
1b.
Yöntemin bu üstün başarısına rağmen, deney konusu
parçaların müzikal uzmanlık bakımından oldukça basit
olduğu söylenebilir. Aktarılan metod yalnızca notaların
tespiti için sonuç vermekte, nota kağıdında yer alan
anahtar, ölçü, diyez, bemol ve duraklama işaretleri gibi
diğer birçok öğeyi göz ardı etmektedir. Ancak, nokta ve
kuyruk tespitleri için kullanılan yöntemlerin
benzerlerinin, bu öğeleri de tespit edecek biçimde
uyarlanması mümkündür.
1c.
Nota yerleşimlerinin doğru tespitini sağlayan sistem
parametre değerlerinin yalnızca kısıtlı sayıdaki matbaa
baskısı nota kağıtlarında denendiği ve el yazısı veya
standart dışı müzik notasyonlarında aktarılan yöntemin
kesin sonuç vermeyebileceği unutulmamalıdır.
2. Bölümün Sonuçları:
2a.
MATLAB ile hazırlanmış olan nota analiz programı,
denenen birçok örnek ses dosyasındaki notaları doğru
biçimde tanımlayabilmiş ve bu açıdan oldukça başarılı
sonuçlar elde edilmiştir. Notaların başlangıç ve bitiş
noktalarının tam olarak belirlenmesi işleminin, sistemin
toplam başarımını etkileyen en önemli adım olduğu
açıktır.
2b.
Programın testi sırasında küçük bir bölüm ses dosyasında
ise kısmen, notaların eksik ya da hatalı tespit
edilebildiği gözlenmiştir. Bu durumun başlıca iki sebebi
olduğu görülmüştür:
·
Özellikle yüksek
tempolu müziklerde kimi notalar henüz doğal ses
zayıflamasını tamamlamadan bir diğer nota çalınmakta ve
bu durum nota başlangıç yerlerinin tespiti için
kullanılan algoritmanın yetersiz kalmasına sebep
olmaktadır. Parça temposuna uygun adaptif bir
düzenlemeyle bu sorunun üzerinden gelinebileceği
düşünülmektedir.
·
Notaların tespiti için
kullanılan kimi ses dosyalarında kayıt ortamından
kaynaklanan gürültü (istenmeyen sesler), notaların
tespitini zorlaştırmaktadır. Ayrıca, bazı enstrümanların
dalga biçimlerinde, notanın kendi frekansından çok,
harmoniklerinin frekansı baskın olarak görülebilmektedir.
Bu gibi bir durumda nota isminin doğru tespit edildiği,
ancak bir oktav incesi olacak biçimde yanlış
tanımlandığı belirlenmiştir.
2c.
Çalışma, yalnızca basit (tek enstrümanla çalınmış ve her
seferinde yalnızca tek bir notanın bulunduğu) müzik
eserlerinin nota analizinin yapılabilmesi için yöntem
önerilerini içermektedir. Profesyonel düzeydeki müzik
eserlerinin analizi için temeli aynı olan bu yöntemler
üzerinde çeşitli düzenlemeler yapılması gerekliliği
ortadadır.
TEŞEKKÜR
Bu çalışma, İTÜ Elektrik-Elektronik Fakültesi Telekomünikasyon
Mühendisliği Lisans Programı süresince verilmekte olan
“Görüntü İşleme Temelleri” ve “Çokluortama Giriş”
derslerinin dönem projeleri olarak hazırlanmıştır.
Proje çalışmalarımı
müzik tekniği üzerinde yapmama olanak sağlayan ve bu
konuda destek olan hocam Sayın Doç. Dr. Işıl CELASUN’a
teşekkür ederim. Ayrıca, bu çalışmaya en başından
itibaren yakın ilgi göstererek destek veren,
enstrümanlardan ses örnekleri toplanması aşaması da
dahil her konuda katkılarını esirgemeyen
Sayın Yrd. Doç. Gülay KARAMAHMUTOĞLU’na
ve İTÜ Türk Musikîsi Devlet Konservatuvarı’nın değerli
öğretim üyeleri ve müzisyenlerine teşekkürlerimi sunarım. |