Tableau Projesi: Bisiklet Paylaşımı ve Hava Durumunun Görselleştirilmesi
Bu makale Alparslan Mesri ve Hakan Elbas tarafından yazılmıştır.

Bu yazımızda sizlere, Tableau ile nasıl veri analizi ve görselleştirme yapılacağını göstereceğiz.
Washington DC bölgesindeki ortak kullanılan bisikletler hakkındaki datayı 2011 yazını esas alarak keşfedeceğiz. Özellikle, hava durumu, haftanın günü ve üye türünün, kullanım miktarını nasıl etkilediğine bakacağız.
Hazırsanız başlayalım...
Tableau, süper güçlü bir veri analizi ve veri görselleştirme aracıdır. Daha fazla veri odaklı olmalarına yardımcı olmak için her tür şirket tarafından geniş çapta benimsenmiştir. Birçok veri bilimcisi, iş analisti ve yöneticinin kullanabileceği önemli bir programdır.
Metro DC alanında 4,300'den fazla ortak kullanım bisikleti vardır.
Data
Bisiklet ortak kullanım datasına buradan ücretsiz olarak ulaşabilirsiniz. Bisiklet ortak kullanım datası ile birlikte yorumlayacağımız yağış miktarı ile ilgili verilere yine buradan ücretsiz olarak ulaşabilirsiniz.
Python ortamında yaptığımız veri temizliği sonucunda veri dosyamız içerisinde şu sütunlar bulunuyor:
Duration: Seyahat süresini ifade eder.
Start Date: Seyahat başlangıç tarihi.
End Date: Seyahat bitiş tarihi.
Member Type: Bisiklet kullanıcısının kayıtlı(Yıllık üye, Özel üye, Güne özel üye) veya ziyaretçi tipi(Tek kullanımlık, 24 Saatlik, 3 Günlük, 5 Günlük) üye olduğunu ifade eder.
HPCP: Saatlik yağış miktarını gösterir.
Sadece Haziran, Temmuz ve Ağustos 2011'e baktığımızda 1.2 milyon civarı kayıt var. Bu nedenle bu alıştırma için çalışmayı bu üç ay ile sınırlandıracağız. Süre ile çalışmayı kolaylaştırmak için Tableau çalışma sayfanıza girdikten sonra hesaplanan bir sütun oluşturabilirsiniz. Saniyeler yerine dakikalar içinde çalışmak istiyorsanız sürenin 60'a yuvarlanması gerekir. Biz bu işlemi python kullanarak yaptık. Siz dilerseniz bunu Excel veya Google E-Tablolar’da da önceden yapabilirsiniz.
NOAA’dan 1 Haziran 2011'den 31 Ağustos 2011'e kadar Reagan Ulusal Havalimanı (DCA) için yağış verilerini aldım. Gerekli işlemleri yaptıktan sonra NOAA, size, veriler indirilmeye hazır olduğunda bir e-posta gönderir. İşlem sadece bir dakika sürer. Biz python kullanarak yağış ve tarih dışındaki .csv dosyasındaki tüm sütunları sildik.
Veri Görselleştirme ve Analiz
Verilerin çeşitli yönlerden inceleyen, görselleştirmeler içeren bir kaç çalışma sayfası yaptık. Sonra birkaçını da bir — — kontrol panelinde birleştirdik ve ortaya burada görebileceğiniz gibi bir hikaye çıkmış oldu. Tabloların medium’a aktarılması mümkün olmadığı için aşağıdaki gibi ekran görüntülerini aldık.




Bu makalede bu derin görselleştirme alanına sadece küçük bir giriş yapmış olduk. Takdir ettiğimiz Tableau programının ileri seviyelerde özellikleri tam sürüm versiyonunda bulunmaktadır. Bunlardan biri de yaptığınız grafikleri etkileşimli olarak web üzerinde yayınlayabilme imkanı sunmasıdır. Eğer dilerseniz siz de bu özelliği araştırıp kendi grafiklerinizi server ile erişeme açabilirsiniz.
En son yaptığımız grafik çift eksenli bir formata sahiptir. Genelde çift eksenli grafikler ilk anda, araştırmacıya resmin bütünü hakkında bir iç görü sunma konusunda çok yararlı olmasa da ölçü birimleri arasındaki ilişkiyi göstermeleri açısından çok yararlı grafikler olabiliyorlar. Bu son grafikte mavi çizgiler toplam bisiklet sürme süresini gösterirken turuncu renkteki çizgiler ortalama yağış miktarını göstermektedir.
Analiz
Grafik-4'de yüksek yağış, bazı durumlarda düşük kullanım oranı ile sonuçlanmaktadır. Görünüşe göre yağmur ve bisiklet sürme süresi miktarı arasında ters bir ilişki var.
Bisiklet sürme miktarlarına bakarken günü saatlerine ayırmak ilginç olabilirdi. Gece geç saatlerde veya sabahın erken saatlerinde yağmurun binicilik üzerinde muhtemelen çok az etkisi vardır. Bu analizi daha sonraki çalışmalarımızda ele alacağız.
Grafik-1'de yaz aylarında pazartesi ve salı günlerinin, haftanın diğer günlerine göre ne kadar daha az bisiklet kullanma miktarına sahip olduğunu görmek şaşırtıcı. bu grafik hafta günü — kullanım ilişkisini çok net olarak gösteriyor.
Grafik-3'de üye kartına sahip olan kullanıcıların, üyelik kartına sahip olmayan kullanıcılara göre çok daha kısa süreler boyunca bisiklet sürdüklerini gösteren veriler araştırmacılar tarafından ilginç bulunabilir. Bu durum üyelerin muhtemelen çoğunlukla işe gidip gelirken bisiklet kullanmaları, öte taraftan üyeliğe sahip olmayan sürücülerin daha çok turistik amaçlar nedeniyle bisiklet kullanmaları ile açıklanabilir. Tabi ki daha fazla veri ile bu konuda daha fazla araştırma yapılarak bu savın doğruluğu incelenebilir.
Grafik-2'de üyelerin ve üye olmayanların toplam bisiklet kullanma sürelerinin neredeyse aynı olduğu gözlemlenebilir. Oysa ki Grafik-3'de üye olmayanların ortalama bisiklet kullanma süreleri çok daha fazla idi. Bu durum bize üyelerin çok daha fazla bisiklet kullanma miktarına sahip olduğu bilgisini sunmaktadır.
Sonuç
Bu makalede, Tableau kullanarak ve iki veri kümesini birleştirerek Washington DC’deki ortak kullanılan bisikletler hakkında bazı ilginç bilgiler bulduk. Tableau, veri analizini hızlı hale getirir; verileri bulmak, temizlemek , birleştirmek, kontrol panelini oluşturmak ve bu makaleyi yazmak sadece birkaç saat sürdü.
Yukarıda bahsedilenlere ek olarak, daha bir çok analiz ve proje Tableau’nun diğer özellikle de kullanılarak yapılabilir. Biz sadece 2011 yılı verilerini kullanarak bu analizi gerçekleştirdik. Büyük resmi görmek için tüm yılların verilerine bakmak bize daha ilginç bulgular sunabilirdi.
Makine öğrenimini kullanarak bir yolculuk tahmini oluşturmak da ilginç olacaktır. Tableau Public, python koduna kolay bağlantılara izin vermiyor, ancak kısa süre önce kullanıcı başına 70 dolara sıçrayan Tableau Masaüstü bunu yapıyor.