Veri Görselleştirme, sadece insanlara bir şeyler anlatmaya değil, bunun da öncesinde verinizin hikayelerini keşfetmenize de yarar. Bunun için de sadece akla ilk gelen grafiği oluşturmakla kalmayıp, alternatif başka grafiklerin bize neler söylediğine de bakabiliriz.
İlk grafiğimiz en klasiklerden bir çizgi grafik ve 8 müşterimize yaklaşık 2 sene boyunca yaptığımız satışları gösteriyor. Ancak değerler birbirine çok yakın ve değişken olduğundan buradan durum okumak mümkün değil. Şimdi, aynı veri setiyle Excel’de oluşturduğumuz 4 farklı grafiğe ve çıkan hikayelere bakalım:
Çoklu Çizgi Grafik
Aylar içerisinde yaptığım satış miktarlarını görmek benim işin önemli ve çizgi grafikteki karmaşa yerine her bir müşterime yaptığım satışı ayrı ayrı öne çıkarıyorum. Sadece mavi çizgiler de verilebilir. Onun yerine diğerlerinin çizgilerini de zaman içindeki kıyası görmek amacıyla grafiğe ekliyorum. 8 müşteri için de bir versiyon hazırlanabilir ancak ben diğer grafiklerle boyutum aynı olsun diye sadece değeri yükselenleri grafikte kullandım.
Eğim Grafik
Zaman içinde, aylar bazındaki tüm değerlerden ziyade, başlangıçtan itibaren nereye geldiğim önemli. O yüzden ara değerleri göstermeyerek nereden nereye geldiğime bakıyorum. Küçük artış azalışların içinde bir müşteride yüksek artış, bir müşteride de yüksek düşüş olduğu bu grafikle hemen yakalanabiliyor.
Kuyruklu Yıldız Grafik
Yine nereden nereye geldiğimi göstermek istiyorum. Bu kez sadece büyük hareketleri değil, her birinin hareketini görmeyi tercih ediyorum. Böylece kimde ne kadar artış, kimde ne kadar düşüş var, kolayca anlatabilirim.
Barkod Grafik
Bu kez önemli olan zaman içindeki değişimden ziyade, güncel (son) değerimin ne durumda olduğu. Diğer aylardaki satış miktarlarıyla karşılaştırıldığında son ay değerinin hangi müşterilerim için kendi değerleri içinde yüksekte, hangileri için düşük düzeyde olduğunu gösterebiliyorum.
Ne kadar çok grafik oluşturabilirseniz, veri setinizden o kadar içgörü almanız mümkün hale gelir. Tüm bu grafikler ve çok daha fazlası Veri Görselleştirme eğitimimizde sizi bekliyor!
Yıllardır Veri Görselleştirme eğitimi katılımcılarımıza, herhangi bir uygulamada veya programlama dilinde nasıl grafik oluşturulacağına dair çözümler bulmaları için Andy Kirk‘ün Chartmaker Directory‘sini kullanmalarını öneriyoruz. Sonunda zaman bulduk ve Directory için bir içerik üretebildik. Excel’de arı sürüsü grafiğinin nasıl oluşturulacağını adım adım anlattığımız blog yazımıza buraya tıklayarak ulaşabilirsiniz.
Daha önce bu grafik türü ile oluşturduğumuz farklı örnekleri de burada paylaşalım:
IF (EĞER) formülünü muhtemelen hepimiz kullanıyoruz. Birden fazla koşulumuz varsa da IF yerine IFS veya AND ve OR (ÇOKEĞER veya VE ve YADA) formülleriyle koşullarımızı da birleştiriyoruz. Peki, ya uygun durum sayısı çoklu duruma izin verirse (İddaadaki sistem gibi :)) ne yaparsınız? Aşağıdaki şekilde bilgileri bulunan ekibimden listedeki koşullardan en az ikisini sağlayan arkadaşlara prim vereceğim. H sütununa Prim Kararı formülünü nasıl yazarsınız? – İstanbul’da çalışmalı – Minimum 15 senelik kıdemi olmalı – Ocak ayı satışı minimum 2000 olmalı – Şubat Ayı satışı minimum 1800 olmalı
Sorumuzun birçok cevabı olsa da, en sade çözüm şu şekilde olacaktır:
Excel’de üç ayrı veri değer tipi var: Metinler, Sayılar ve İkili Veri (yani TRUE/FALSE, DOĞRU/YANLIŞ verisi)
İkili verileri mantıksal önermelerin, yani tanımlanan eşitlik veya eşitsizliklerin değerlendirmesinin sonucu olarak ve formüllerde parametre olarak kullanabiliriz. Eğer tanımladığımız eşitlik/eşitsizlik doğru ise TRUE, yanlış ise FALSE olarak kodlanır ve Excel bu değerleri sayısal karşılık olarak 1/0 olarak formülün içerisinde kullanmamıza izin verir. Formülde yazdığımız koşul kısmında 1 eşitlik ve 3 eşitsizlik var ve az önce açıkladığımız şekilde Excel her birini 1 veya 0 olarak sonuçlandıracak. Böylece toplamlarını aldığımızda kaç tanesinin doğru olduğu sonucuna erişeceğiz. 2 veya daha fazlası doğruysa da IF’in içindeki total koşulumuz doğru olacak.
Not: Formül içi parametrelerde gerekmesi halinde TRUE/FALSE yerine biz de direkt 1/0 kullanabiliriz. Örneğin en sık kullanılan formüllerden birisi olan VLOOKUP (DÜŞEYARA) formülünde, son parametre olarak aranan değerle ilgili eşleşme tipini girmemiz gerekir ve tam eşleşme için FALSE veya yaklaşık eşleşmeye onay vermek için TRUE yazarız. Bu formülü elle yazanlar bilirler ki, TRUE FALSE diye uzun uzun 🙂 yazmak yerine, TRUE yerine 1, FALSE yerine 0 da girebiliriz. Çünkü Excel’de TRUE/FALSE’u zaten 1/0 olarak da formüllerimizde kullanabiliriz. Burada farklı bir durumu daha açıklamak gerekir. Her ne kadar biz TRUE/FALSE değerini formüllerin içinde 1/0 olarak girsek de, aslında 0 değil/0 diye tanımlamak daha doğru olacaktır. Yani herhangi bir eşitlik eşitsizlik yerine, bir sayısal değeri önerme kontrolü noktasında kullanmak istersen Excel değerin 0 olup olmamasına bakar.
Geçtiğimiz günlerde Linkedin üzerinden bir post paylaşarak şu soruyu gündeme getirmek istedim: Sütun grafik ile alan grafik arasında bir fark var mı? Varsa nedeni nedir? Hangi vakada hangisi kullanılmalı?
Kullandığım örnekler de aylık ciro ve aylık kasadaki nakdimizin gösterimiydi. Bu örneklerde sütun veya alan kullanma kararı verirken neye dikkat etmeliyiz? Bu sorunun cevabını verebilmek için bu iki grafiğin arasında nasıl bir fark olduğuna bakmak gerekir.
Görsel algımızı anlatmaya yarayan psikolojideki Gestalt prensiplerinden birisi Bağlantı prensibidir. Bu prensip bize şunu söyler: Birbiriyle bağlantılı şekillerin ortak bir anlamları olduğunu, bağlantısı bulunmayanların ise birbirinden bağımsız anlamları olduğunu düşünürüz.
Sütun grafikle alan grafik arasındaki temel farklılık, bu iki grafikteki değerlerin birbirlerinden bağımsız veya birbirleriyle bağlantılı ilerlemesidir. Örneklerimizdeki vakaları da bu fark üzerinden değerlendirmek gerekir.
Ciro grafiğinde aylık değerlerimiz birbirinden bağımsızdır. Yani Ocak ayındaki 111binlik ciro ile Şubat ayındaki 58binlik ciro, birbirinden ayrı satışların değerleridir, birbirleriyle ilişkileri yoktur. Bu yüzden ciro grafiği için, değerleri birbirlerinden ayrı görselleştiren sütunların kullanılması daha uygundur.
Kasadaki nakitte ise durum farklıdır. Şubat ayındaki 490 binlik nakdin yüksek ihtimalle büyük bir kısmı Ocak ayındaki 524binlik nakdin içindedir. Yani birbirlerinden tamamen bağımsız değerler değiller, birinin bir miktar değişimiyle oluşan diğer bir değer şeklindeler. Bu yüzden kasadaki nakit grafiğinin birbirlerinden bağımsız görselleştirilen sütunlarla değil, birbirleriyle ilişkili ilerleyen alanla oluşturulması daha uygundur.
Tabii ki bu durum katı bir kurala bağlı değildir. Genel bir görsel algılama doğrusu olmakla birlikte, grafiği okuyacak kişilerin alışkanlıklarına ve verilerin büyüklüğüne göre grafik seçimimiz değişebilir.
Sunum şablonlarının ilki 2021 takvimi üzerine. Toplamda 33 slaytlık bu şablona, AKUT, ÇYDD, LÖSEV, TEGV veya TEMA kurumlarından en az birine, minimum 20 TL’lik bir bağışta bulunup makbuzunu tasarim@denizaksoy.com adresine göndererek sahip olabilirsiniz.
Ben Sema Doğan, Türk-Alman Üniversitesi Endüstri mühendisliği son sınıf öğrencisiyim, geliştirirken gelişmeyi amaç edinmiş, enerjimi üreterek harcayan ve bu sayede iç huzurumu yakalamaya çalışan biriyim. Gelişim yolculuğumda sevgili Deniz Abi ile Veri Görselleştirme eğitimi sayesinde tanışmış oldum ve yaklaşık 20 gün önce 12 saatlik Veri Görselleştirme eğitimini tamamladım. Bunun üzerine ilgimi de çektiği için öğrendiklerimi pekiştirmek amacıyla ilk grafiğimi Linkedin’de paylaşmıştım. (https://www.linkedin.com/posts/semaadogaan_verigaemrselleagntirme-bidaesnyaiaexerik-activity-6712001950117838848-2TUS Buradan ilk haline ulaşabilirsiniz.) Grafiği hazırladıktan sonra Deniz Abiye geri bildirim almak için sordum ve onun da gelişim bildirimleriyle grafiğimin son halini hazırlamış bulunuyorum. Bu yazıda da veriyi nasıl görselleştirdiğimi anlatmaya çalışacağım.
Benim kullandığım kaynak Türkiye Yayıncılar Birliği’nin yayınladığı “Verilen Bandrollerin Kategoriler Bazında Karşılaştırılması” (https://lnkd.in/dK4k-F8) ile alakalıydı. Ben de buradan seçtiğim veriyle bir grafik oluşturdum.
Öncelikle veriye baktığımızda görselleştirmek istediğimiz mesajı belirlemeliyiz. Benim yapmak istediğim 2019 ve 2020 yıllarındaki kategorilere ait bandrol verilen kitap adetlerini karşılaştırmak. Kategori bazında bir karşılaştırma yapacağım için Kümelenmiş Sütun Grafiği kullanmam, vermek istediğim mesaj için daha uygun.
Tabloyu şekildeki gibi seçtikten sonra Insert sekmesinden grafikler bölümünden kümelenmiş sütun yani Clustered Column seçiyoruz. Zaten Excel standart grafiğini oluşturuyor.
Herhangi bir sütuna sağ tıklayıp Format Data Series dediğimizde sağ tarafta sütün kalınlığını ve birbirlerine olan çakışıklıklarını ayarlayabileceğimiz panel açılıyor. Buradan Gap Width yani sütun kalınlıklarını belirleyeceğimiz bölümü %50 olarak değiştiriyoruz. Böylece sütunlarımız daha kalın ve göze hitap eder bir hale geliyor. Ardından Series Overlap dediğimiz sütunların birbiriyle olan çakışmasını ayarlıyoruz. Küme görüntüsü vermek istediğim için sütunları sınırda tutarak bunu da %0 olarak değiştiriyorum.
Vermek istediğimiz mesaja uygun bir başlık belirledikten sonra başlığı sola yaslıyoruz ve eğer belirtmek istediğimiz bir ek bilgi varsa bunu da hemen başlığın altına okunabilecek boyutta ve gri tonlarında seçebiliriz. Diğer yandan veri etiketlerini göstermek için Add Data Labels diyerek veri etiketlerinin görünür olmasını sağlayabiliriz.
Eklediğimiz veri etiketlerinin okunması hayli karışık. Grafiği okuyucu gördüğünde yaklaşık 10 saniyede vermek istediğimiz mesajı karşı tarafa iletmeliyiz. Bu yüzden veri etiketlerini daha sade hale getirerek karmaşıklığı ortadan kaldırabiliriz. Sütunlardan birine sağ tıklayıp Format Data Labels dediğimizde yan tarafta açılan panel üzerinde Number kısmında düzenleme yapabiliriz.
Number bölümünde sayıyı biçimlendirebiliriz. Daha sade ve anlaşılır olması açısından ben bu şekilde kullandım. Diğer sütuna da aynı şekilde veri etiketi ekleyip düzenleme yapabiliriz.
Veri etiketlerini sütunlar üzerinde kullandığımız için sol taraftaki eksenler ve gridline dediğimiz ızgaraları kaldırarak sadeliği yakalayabiliriz.
Grafiğimizin son kısmında ise istediğimiz renkleri kullanabiliriz. Legend yani veriyi belirten başlıkları kullanmamak için başlıkta yazan yıllarda kullanılan renk ile sütunlar da kullanılan rengi eşleştirerek legend kullanmamış olduk. Böylece vermek istediğim mesaj tam anlamıyla en sade şekilde grafik üzerinde bulunuyor.
Benim Veri Görselleştirme yolculuğum böyle başladı ve keyifli bir şekilde de devam ediyor. Faydalı olması dileğiyle..
Admin notu 🙂
Uzun süredir aklımda olan bir şeydi, başka arkadaşlarımın da yazılarını sayfamda paylaşmak… Sağolsun Sema sayesinde başlangıcını yapmış oldum. Umarım onun bu güzel paylaşımı başka arkadaşları da heveslendirir…
2 hafta önce salgına dair kendi grafiklerimi oluşturmuş ve paylaşmıştım. Gelen yorumlar üzerine bir grafikte değişiklik yapmak ve 1 de yeni grafik eklemek istedim.
Öncelikle şunu yeniden vurgulayayım, ben burada bir kişiyi kurumu suçlamaya/aklamaya çalışmıyorum. Sadece veri görselleştirme konusunda ilgili ve biraz da bilgili biri olarak, kamuya açıklanan datayı okumaya ve yorumlamaya çalışıyorum.
Günlük yeni vakalarda maalesef ibre yukarıyı göstermeye devam ediyor. Her ne kadar hastanelerden gelen haberler çok daha ciddi olsa bile, burada açıklanan verileri bile bir an önce aşağı yöne çekmek gerekiyor.
Günlük vefat sayımız Haziran ayının başından beri, yani yaklaşık 3 aydır 15-25 bandında açıklanıyor. İncelediğim hiçbir ülkenin benzer bir grafiği yok… Yine de son bir haftadır çok küçük hareket olsa da yukarı doğru bir yönelme burada da var, aman dikkat 🙁
Bana en garip gelen verilerin grafiği İyileşenler… 2 hafta önce paylaştığım gibi, Haziran ayının ve Temmuz ayının başındaki 5’er günlük “ataklar” olağan standart sapmalarla anlatılabilecek gibi durmuyor. Umarım gerçekçi, mantığa uygun bir tıbbi açıklamasını duyar ve paylaşırım sizinle de… Güncel değerlere gelince, son 1 aydır iyileşen sayısı 1.000-1.200 bandına yerleşmiş durumda.
Geçtiğimiz sefer Linkedin’den paylaştığımda en fazla tepki ve yorum alan grafik buydu. Bu grafikte de, yukarıda bahsettiğim iyileşenlerdeki atakların, 20 gün öncesinin yeni vaka değerleriyle uyuşmazlığı görülüyor. Bu grafiğe gelen ve haklı bulduğum yorum, vakalarla sadece iyileşenlerin değil, vefatların da kıyaslanması gerektiğiydi. ben de bu grafiği Sonuçlanan-20 Gün Önceki Vaka olarak yeniden hazırladım:
Tabii en başından beri, vefat sayılarının (çok şükür ki) vaka sayıları içinde çok küçük bir payı olması nedeniyle, çizgide büyük bir hareket yaratmadı.
Gelen bir diğer talep de aktif vakaların takip edilmesiydi. Onun için de, bazı günler artış bazı günler azalış gösterdiğinden, sütun veya çizgi grafik yerine şelale grafiği tercih etmek istedim:
Bana anlamsız gelen 5 günlük atakların aktif vaka sayısına etkisini görebilirsiniz. Sanki bir güç aktif vaka sayısını 30.000’lerden 20.000’lere, sonra da 20.000’lerden 15.000 altına indirmek istemiş gibi…
3 gün önce Twitter’da Ivett Kovacs’ın aşağıdaki tweetini görünce tabii ki heyecanlandım. Aklıma gelen ilk soru “Acaba bu minik hileyi (trick dememeye çalışıyorum) Excel’de uygulayabilir miyim?” oldu…
İlk görev (challenge dememeye çalışıyorum) toplam değer ile ürünlerin değerlerinin yığılmış hallerinin üst üste gelmesini sağlamak.
Aklıma ilk gelen yığılmış ürün satışı sütunlarıyla, toplam sütunlarını iki ayrı eksende üst üste oturtmaktı. Nasılsa toplam değerler her ikisinde de aynı olacak, dolayısıyla eksenlerin maksimum değerlerini eşitlemek gibi bir derdim olmayacaktı.
Bu durumda kaydırıcı (tahmin ettiğiniz gibi burada da slider dememeye çalışıyorum) ilerledikçe, yani elimdeki ana değişken 0 ile 12 arasında bir değer aldıkça toplam değerin üstüne yığılmış ürün toplamlarının gelmesini sağlamam gerekiyor. Bunu da, grafiğin baktığı tabloda, kaydırıcının değerine göre ürünlerin satış değerlerini gösterip göstermeme koşulunda kullanarak yapabilirim.
Tam bu noktada, madem kaydırıcı ürün değerlerinin gösterilip gösterilmemesine yarayacaksa, ikinci ekseni kullanmaya ihtiyacım yok. Ürünlerin yığılmış grafiğine toplam değerini de ekleyebilirim. Dolayısıyla durum şöyle oldu: (Verileri tesadüfi oluşturdum) (parantez içinde yeni parantez açmak istemedim ama siz zaten bu sefer de random dememeye çalıştığımı anladınız)
Elimdeki değerler tablosunun yanında bir sütun boşluk bırakıp, aynı tabloyu bir kez daha yapıştırdım. Bu kez ürünlerin satış değerlerinin yerine şunu yazmam gerekiyor: Eğer kaydırıcının değeri 0’sa yani kaydırıcı en soldaysa o zaman ürünlerin değerlerini gösterme, sadece toplamı göster. Eğer kaydırıcının değeri (A1 hücresinde tutacağım bu değeri), verimin satır numarasına (buradaki örnekte kaçıncı ay olduğu) büyük eşitse de, ürünün satış değerini göster, toplamı gösterme. Örneğin kaydırıcımın değeri 2 ise, Ocak ve Şubat ayları için sadece ürün satışlarını göster, geri kalan aylar için ise sadece toplamı göster. Bu sayede tüm değerler grafiğimizde üst üste yer alsa bile biz her bir ay için sadece ürünleri veya sadece toplamı göreceğiz.
Şimdi sağdaki tablonun 4 sütununu da aynı yığılmış sütun grafikte, tek eksende kullanabilirim.
Şimdi biraz makyaj vakti… Y ekseninde bu kadar fazla bölünmeye ihtiyacımız yok, bölüm birimini 200’den 500’e çektim. Ürünlerin renkleri böyle kalsın, toplamın farklı bir ürün olduğunu düşündürmemek için onun rengini griye çevirdim. Sütunlar arası boşluğu optimum değer olan sütun kalınlığının yarısına kadar düşürdüm. X ekseninde tekrarlayan yıl bilgisini ortaklaştırdım. Grafiğin başlığını sol üste alıp değiştirdim. Grafiğin altındaki açıklama bölümünü, X ekseninin değerleriyle karışmaması için grafiğin sağ üstüne aldım. Ve son olarak grafiğin genel çerçevesini kaldırdım.
Şimdi sıra kaydırıcıyı yerleştirmekte. Eğer yukarıdaki menü sekmelerinizde Developer menüsü yoksa önce onu aktifleştirmeniz gerekiyor. File/Options/Customize Ribbon menüsünden giderek, ekranın sağdaki bölümünden Developer menüsünün işaretini açabilirsiniz. Şimdi Developer menüsünden, Insert/Form Controls/Scroll Bar seçerek kaydırıcımızı ekliyoruz. Kaydırıcıya sağ tıklayıp Format Control diyerek ayarlarına gireceğiz.
Kaydırıcımızın ilk değeri 2 olsun. Minimum değerimiz 0, maksimum değerimiz 12 olacak. (Eğer farklı bir tablonuz varsa max değerini kendinize göre belirlemeniz gerekecek) Kaydırıcının yanlarındaki küçük oklara tıklandıkça gerçekleşecek değişim 1’er birim olsun. Kaydırıcının içinde bir noktaya tıklasak da 1 birim gitsin. Son olarak kaydırıcımızın değerini A1 hücresine yazdırmak istediğimi söyledim.
Ürün satışlarına veri etiketi ekleyip, yazı tipimi ve grafiğin boyutunu da değiştirerek grafiğimi tamamladım:
Etkiyi daha net göstermek için bir de GIF olarak ekliyorum:
Geçtiğimiz günlerde Statista bir grafik yayınladı. Görselde, 2030 yılında gelişmiş ülkelerde beklenen ortalama yaşam süreleri karşılaştırılmıştı ve Amerika’nın diğer ülkelerle kıyası yapılmıştı. Grafiği görünce Türkiye’nin bu grafikte yer alsa ne konumda olacağını merak edip araştırmaya başladım ve Tilasto’nun web sayfasında Türkiye’de 2030 yılında beklenen ömür sürelerine ulaştım. Şimdi sıra grafiği Türkiye’yi içerecek şekilde yeniden hazırlamaya geldi…
Statista’da yayınlanan 2030 grafiği
Ancak Statista’daki grafikte kullanılan kümelenmiş çubuk grafik kullanımı verilerin karşılaştırılması için yeterince sade gelmedi bana. Ülkelerin her birinde kadın-erkek kıyası yapılabiliyor ama kadınların ve erkeklerin ülkeler arasındaki kıyası bu grafikte kolayca yapılmıyor. Bu yüzden karşılaştırma yapmamı sağlayacak başka bir grafik seçmek istedim ve biraz bakındıktan sonra dumbbell chart (bağlantılı noktasal grafik) kullanmaya karar verdim. Excel’deki grafikler içerisinde yer almayan bu grafiği, dağılım grafiğini (scatter plot) düzenleyerek oluşturmak mümkün. Şimdi adım adım grafiği beraber oluşturalım:
Öncelikle veri setimiz bu şekilde:
Bu tabloyu seçip de scatterplot oluşturmak istediğimde excel’in bana verdiği grafik ise aşağıdaki gibi oluyor:
Excel satırlarda yer alan kategori başlıklarını yani ülke isimlerini grafiğe veri olarak almadı, X eksenine ülkeler için otomatik 1’den 11’e numaralandırma yaptı ve yaş bilgilerini Y eksenine yerleştirdi. Eğer ülke bazlı bir karşılaştırma değil de, bir ülkenin farklı yıllardaki ortalama kadın/erkek yaşam sürelerini kıyaslamak isteseydim bu şekilde bir yerleşim uygun olabilirdi ve makyajın ardından finalde de şuna benzer bir grafik elde ederdim:
Ancak bu kez yapmak istediğim kıyas ülke kıyası ve ülke isimlerini x eksenine yerleştirmektense, y eksenine yerleştirip daha kolay okunmalarını sağlamayı tercih ediyorum. Bunu yapabilmek için grafikte kullanılacak veri setini benim tanımlamam daha doğru olacak. Bu yüzden şimdi scatterplotu, tabloyu seçmeden, hatta içinde veri olan bir hücre seçili değilken ekliyorum ve boş bir grafik ekranı elde ediyorum. Bir sonraki adımda yapmam gereken, grafiğe sağ tıklayıp Select Data (Veri Seç) diyerek grafikte kullanılacak serileri (Kadın/Erkek) tanımlamak:
Ekranın solundaki Legend Entries kısmında Add diyerek ilk serimi tanımlıyorum.
Serinin adını tanımlamak için istersem tablodan başlığın yer aldığı hücreyi seçebilir, istersem de burada doğrudan metin olarak girişini yapabilirim. Erkekler için X ekseninde yer almasını istediğim değerler ortalama ömür verisi, Y ekseni için ise ülke adı yerine tabloma eklediğim ülke numaraları alanını seçiyorum. Y ekseninde değerler aşağıdan yukarıya doğru arttığından, grafikte en üstte yer almasını istediğim Güney Kore’ye en büyük, en altta yer alacak Türkiye’ye de en küçük değeri verdim:
Aynı şekilde bir kez daha Add komutuna tıklayıp, aynı tanımlamaları bu kez de kadınlar için yaptıktan sonra Excel’in oluşturduğu grafik şu şekilde:
Burada erkeklerin ortalama ömürlerini mavi noktaların X eksenindeki izdüşümünden, kadınların ömürlerini ise turuncu noktaların izdüşümünden göstermiş oluyorum.
Tabii bir sonraki amacım Y eksenine ülkelerin isimlerini yazdırmak. Bunu bu grafiğe yeni bir seri ekleyip, eklediğim serinin grafik tipini çubuk grafik olarak değiştirerek sağlayabilirim. Ancak o durumda çubuklarla noktaların konumlarını üst üste çakıştırmak için ince ayarlar yapmak gerekiyor. O yüzden ben daha kolay bir yol için, biraz Excel’i kandırmayı tercih ediyorum 🙂 Y ekseninin başlıklarını yazdırabilmek için, erkek ve kadın serilerinden daha solda, sabit bir değere sahip bir seri daha ekliyorum:
Grafiğime yine Select Data menüsünden, Erkek ve Kadın serilerini eklediğim şekilde, X ekseni değerleri E sütunundaki 75’ler, Y ekseni değeri olarak da yine A sütunundaki numaralar olacak şekilde Y başlık serisini ekliyorum. Grafiğimin geldiği nokta bu:
Excel yeni veriler gelince X eksenimi 0’dan başlatmaya karar verdi. Benim ise buna ihtiyacım yok, aksine yeni eklediğim gri noktaların grafiğimin en solunda başlık bölümünü oluşturmasını istiyorum. O yüzden X eksenindeki değerlere sağ tıklayıp Format Axis diyorum ve açılan menüden eksinin minimum değerini 75 olarak değiştiriyorum:
Sırada her bir noktanın yanına ilgili ortalama ömür değerini yazdıracağım veri etiketlerini (data label) eklemek var. Önce kadınlara ait olan turuncu noktalara sağ tıklayıp Add Data Labels diyorum. Excel default olarak noktaların Y değerlerini veri etiketi olarak ekliyor:
Tabii bu grafik için benim ihtiyacım olan noktaların Y değerleri değil, X değerleri. Bu yüzden bu kez eklediğim veri etiketlerine sağ tıklayıp Format Data Labels diyorum ve gelen pencerede X values seçeneğini işaretleyip, Y values işaretini kaldırıyorum:
Aynı işlemleri bu kez erkeklere ait olan mavi noktalarım için yapıyorum, tek bir farkla. Veri etiketlerinin konumunu noktanın solunda olarak değiştirmem gerek:
Gelelim gri noktaları başlıklara çevirmeye… Veri etiketi ekleme işini bu kez de gri noktalar için yapıyorum:
Bu sefer ihtiyacım olan ne X, ne de Y değeri… Bu yüzden Label Contains alanından Values from Cells diyerek benim seçeceğim hücrelerdeki veriyi, veri etiketi olarak göstermesini istiyorum ve gidip B sütunundaki ülke isimlerini (başlığı almadan) seçiyorum. Daha sonra X values işaretini kaldırıyorum ve veri etiketinin konumunu noktanın solu olarak değiştiriyorum:
Ben her ne kadar noktanın solunda görmek istediğimi söylesem de, grafiğimde noktaların yer aldığı çizim alanının (plot area) yani gri karelere bölünmüş alanın dışında başlıkların sığacağı kadar yer yok. O yüzden ülke isimleri halen noktanın üzerinde kalıyor. Bunu düzeltmek için çizim alanının içinde bir boşluğa sol tıklayıp çizim alanını seçiyorum ve sol kenarının ortasından tutup içeri doğru küçülterek, grafiğimin solunda başlıkların sığacağı bir alan açıyorum:
Y ekseni değerlerinin kolayca okunmasını sağlayan çizgiler (gridlines) an itibariyle 2’şer 2’şer ilerliyor. Bunu Y ekseni değerlerinden birisine (0 veya 12’ye tıklamak kolay) sağ tıklayıp Format Axis diyerek açtığım pencerede Major Unit değerini 1 olarak değiştirerek her ülkenin değerlerinin birer çizgi üzerinde yer almasını sağlıyorum:
Fakat bu şekilde gelen görüntüde aslında bu çizgiler değerlerin okunmasını zorlaştırıyor. O yüzden noktaları çizgilerin üzerine değil de, arasına yerleştirmek daha uygun olacak. Bunun için de yine Y eksenimde Format ayarlarıma giriyorum ve 0 olan minimum değerini 0,5’e, 12 olan maksimum değerini de 11,5’e değiştiriyorum:
Artık Y ekseninde yer alan sayısal değerlerle de işim kalmadığından, oradaki değerlerden birine sol tıklayıp tamamını seçerek Delete tuşuna basıyorum:
X ekseninden gelen gridline’ları da azaltarak sadelik sağlamak amacıyla, X eksenindeki değerlerden birisine sağ tıklayıp Format Axis diyorum. Minimum değer 75 kalacak şekilde, bu kez unit değerini 5 olarak değiştiriyorum. Bu şekilde 2’şer 2’şer değil de daha az çizgi çekilmiş olacak:
Sıra geldi dumbbell’larımızın tutacak kısımlarını oluşturmaya, yani kadın ve erkeklerin arasındaki farkı görselleştirecek çizgileri çekmeye. Bunun farklı yolları olsa da, bana en kolay gelen çözüm Error Bars, yani hata çubukları. Normalde bu çubuklar, dağılımdaki bir noktanın tam yerini belirleyemediğimiz durumlarda “bu nokta buralarda da olabilir” anlamında kullanılır; ancak ben bu kez farklı bir fayda sağlayacağım. Kadınların turuncu noktalarından birine sol tıkladıktan sonra, grafiğimin sol üst dışında yer alan küçük artı ikonundan (bu ikonu göremezseniz yukarıdaki menüde Chart Tools/Design menüsünde en solda yer alan Add Chart Element butonuna da tıklayabilirsiniz) Error Barsı ekliyorum:
Hem dikey hem de yatay, ikişer yönlü hata çubuklarım geldi. Benim ihtiyacım olansa sadece negatif yöne yani sola doğru gidecek olan yatay hata çubuğu. İlk önce yukarı aşağı yönlü hata çubuklarından birisine tıklayıp Delete diyerek dikey yönlü hata çubuklarını siliyorum:
Şimdi Excel’e istediğim çubuğun uzunluğunu tanımlama zamanı. Peki çubuğumun boyu ne kadar olmalı? Çubuğumun boyunu Excel’in çekebilmesi için bir sütun daha ekliyorum ve formülünü de Kadınların ömrü-Erkeklerin ömrü olarak yazyorum:
Yatay hata çubuğuna sağ tıkladığımda açılan pencereden, yönü sadece Minus yani eksi olarak değiştiriyorum. Error Amount olarak da Custom seçip, Değerleri tanımla butonuna tıklayarak son eklediğim Fark sütununun verilerini gösteriyorum:
Ve işte artık dumbbell grafiğim hazır… Buradan sonrası tamamen makyaj işlemleri. Başlıkların gri noktalarını ülkelerin bayraklarıyla değiştirdim, fontları değiştirdim, renkleri değiştirdim, kadın ve erkeklerin noktalarının ikonlarını değiştirdim, veri etiketlerinin renklerini değiştirdim, başlığıma grafikten çıkarılmasını istediğim mesajımı yazdım ve veri kaynaklarımı ekledim…
Öncelikle söylemek istiyorum: Hastalık hakkında bilgisi, fikri olan bir insan değilim. Dolayısıyla bu yazı üzerinden herhangi bir yönlendirme yapmak değil amacım. Sadece veri görselleştirmeyle ilgilenen biri olarak, bu konuda son günlerde dolaşan grafiklerle ilgili küçük bir yorumumu paylaşmak istiyorum. Bu yorumum sadece hastalığa dair değil, işlerimizde de kullandığımız grafikleri okuyucularımıza doğru (veya istediğimiz şekilde) yorumlatmamızı sağlayacaktır.
Sanıyorum kendimi bildim bileli ilk kez dünya bu kadar büyük bir kriz yaşıyor ve böyle bir anda toplum psikolojisini doğru yönetmek çok önemli. Aşağıdaki grafik hastalığın ölümle sonuçlanan vakalarını anlatmak için BBC tarafından hazırlanmıştı (ben de Türkçe’ye çevirdim):
Grafikte, değerleri okumadan önce çubukların uzunluklarına odaklanıyoruz ve karşılaştığımız manzara 70 yaş üstü sevdiği bir insan bulunan herkes için korkunç olsa gerek… Peki değerlerin bu şekilde görselleştirilmesi doğru mu? Grafikte hiçbir mantık hatası veya yanlış bilgi bulunmuyor. Ancak unutmamak gereken şey şu, grafikteki en yüksek veride bile 100 hastanın 15’inde (bu değeri de küçümsemeden söylüyorum) ölüm yaşanıyor. Dolayısıyla toplumu doğru yönlendirmek için grafiğin şu şekilde paylaşılmasını daha doğru buluyorum:
Hatta tüm vakaların da grafikte yer alması kıyaslamayı daha doğru yapmamızı sağlayacaktır:
Tabii ki başka bir algı yönetimi de ölümleri değil, ölümle sonuçlanmayan vakaları grafikte göstermek olabilir:
Yakın bir zamanda bir de bu konuda paylaşılan haritalar üzerinden de bir yazı yazmayı planlıyorum. Umarım o anda da hala Türkiye’yi kırmızıya boyamadan hazırlayabilirim.