Veri, günümüzde bilgi çağında işletmeler ve araştırmacılar için kritik bir varlık haline gelmiştir. Bu yazıda, çeşitli konularda zengin ve ücretsiz veri setlerine erişim sağlayabileceğiniz en iyi kaynakları keşfetmeye hazır olun. Veri dünyasına bir yolculuk yaparak, analizlerinizi güçlendirecek ve projelerinize derinlemesine içgörüler katmanın yollarını keşfedeceksiniz.
- Amazon AWS Public Datasets: AWS tarafından sağlanan çeşitli açık veri setleri.
- Awesome Public Datasets GitHub Repositories: GitHub üzerindeki çeşitli veri seti koleksiyonları.
- Bike Share Data Systems: Dünya genelinde bisiklet paylaşım sistemleri ile ilgili veri setleri.
- Bureau of Labor Statistics (BLS) Data: ABD İş İstatistikleri Bürosu tarafından sağlanan istihdam ve iş gücü veri setleri.
- Data.gov: ABD hükümeti tarafından sağlanan geniş veri setleri.
- DataHub: Çeşitli konularda açık veri setleri içeren bir platform.
- Eurostat: Avrupa Birliği İstatistik Ofisi tarafından sağlanan istatistik veri setleri.
- European Data Portal: Avrupa Birliği tarafından sağlanan açık veri setleri.
- European Social Survey: Avrupa’da toplumsal değişim ve görüşlerle ilgili veri setleri.
- FED (Federal Reserve Economic Data): Ekonomi ve finans ile ilgili veri setleri.
- Federal Aviation Administration (FAA) Data: Amerika Federal Havacılık İdaresi tarafından sağlanan havacılık veri setleri.
- Federal Bureau of Investigation (FBI) Crime Data: FBI tarafından sağlanan suç veri setleri.
- FiveThirtyEight: İstatistik ve analiz odaklı bir haber kuruluşunun veri setleri.
- Free Music Archive (FMA) Datasets: Müzik ve ses analizi için FMA’nın sağladığı açık veri setleri.
- Gapminder: Dünya genelindeki sosyoekonomik verilere odaklanan bir platform.
- Global Burden of Disease (GBD) Study: Dünya genelinde hastalık yükü ve sağlıkla ilgili veri setleri.
- Global Database of Events, Language, and Tone (GDELT): Dünya genelinde olaylar, dil ve ton analizi için büyük bir veri seti.
- Global Fire Atlas: Dünya genelindeki yangınları izleyen ve kaydeden veri seti.
- Google Books Ngrams: Google Books aracılığıyla milyonlarca kitaptan oluşturulan dil ve kültür analizi veri seti.
- Google Cloud Public Datasets: Google Cloud tarafından sağlanan geniş bir açık veri setleri koleksiyonu.
- Google Dataset Search: Google tarafından indekslenen çeşitli veri setleri.
- Google Trends: Google’da günlük olarak popüler arama trendlerini gösteren veri setleri.
- HackerRank Developer Skills Report: Yazılım geliştiricilerin becerileri ve iş trendleri hakkında veri seti.
- Harvard Dataverse: Harvard Üniversitesi tarafından sağlanan bir veri deposu.
- Humanitarian Data Exchange (HDX): İnsani yardım ve kriz yönetimi ile ilgili veri setleri.
- IMF Data: Uluslararası Para Fonu tarafından sağlanan ekonomik ve finansal veri setleri.
- International Energy Agency (IEA) Data and Statistics: Uluslararası Enerji Ajansı tarafından sağlanan enerji ile ilgili veri setleri.
- Kaggle Datasets: Veri bilimi yarışmaları ve projeleri için çeşitli veri setleri.
- Microsoft Research Open Data: Microsoft Research tarafından sağlanan açık veri setleri.
- Million Song Dataset: Bir milyondan fazla şarkı üzerine çeşitli müzik özelliklerini içeren veri seti.
- National Aeronautics and Space Administration (NASA) Open Data: NASA tarafından sağlanan uzay ve bilim veri setleri.
- National Cancer Institute (NCI) Genomic Data Commons: Kanser genomi verileri.
- National Center for Biotechnology Information (NCBI) Databases: Biyoloji ve biyoteknoloji alanında geniş veri setleri.
- National Centers for Environmental Information (NCEI): NOAA tarafından sağlanan çeşitli çevresel veri setleri.
- National Institute of Mental Health (NIMH) Data Archive: Ruhsal sağlık ve nörobilimle ilgili veri setleri.
- National Longitudinal Survey of Youth (NLSY): ABD’deki gençlerin ve genç yetişkinlerin yaşam döngüsü üzerine uzun vadeli bir panel çalışması.
- National Oceanic and Atmospheric Administration (NOAA) Data Catalog: NOAA tarafından sağlanan çeşitli veri setleri, özellikle iklim ve hava durumu.
- National Renewable Energy Laboratory (NREL) Data: Yenilenebilir enerji ve enerji verimliliği ile ilgili veri setleri.
- National UFO Reporting Center (NUFORC) Databases: UFO gözlemleri ile ilgili bir veri seti kaynağı.
- Open Data Network: Farklı şehirler ve bölgeler için açık veri setleri.
- Open Data Portal by European Union: Avrupa Birliği tarafından sağlanan açık veri setleri.
- OpenStreetMap: Kullanıcılar tarafından oluşturulan açık harita veri setleri.
- Pew Research Center Data: Kamuoyu araştırmaları ve anket veri setleri.
- ProPublica Data Store: Gazetecilik odaklı, çeşitli konularda veri setleri.
- The Data Incubator’s Data Sets: Çeşitli konularda veri bilimi projeleri için kullanılabilecek veri setleri.
- The Movie Database (TMDb) API: Film ve televizyon veri setleri.
- The World Bank Climate Change Knowledge Portal: İklim değişikliği ve meteoroloji verileri.
- The World Factbook by CIA: CIA tarafından sağlanan dünya genelindeki ülkelerle ilgili veri setleri.
- U.S. Census Bureau Data: ABD Nüfus Sayım Bürosu tarafından sağlanan demografik ve ekonomik veri setleri.
- UNICEF Data: UNICEF tarafından sağlanan çocuklarla ilgili veri setleri.
- United Nations Development Programme (UNDP) Data: Birleşmiş Milletler Kalkınma Programı tarafından sağlanan kalkınma ile ilgili veri setleri.
- United Nations Statistics Division: Birleşmiş Milletler İstatistik Bölümü tarafından sağlanan küresel istatistikler.
- United States Department of Agriculture (USDA) Economic Research Service: Tarım ve gıda ekonomisi ile ilgili veri setleri.
- United States Environmental Protection Agency (EPA) Data: ABD Çevre Koruma Ajansı tarafından sağlanan çeşitli çevresel veri setleri.
- United States Social Security Administration (SSA) Data: Sosyal Güvenlik numaraları ve popüler isimlerle ilgili veri setleri.
- World Health Organization (WHO) Global Health Observatory: Dünya Sağlık Örgütü tarafından sağlanan küresel sağlık veri setleri.
- World Bank Data: Dünya Bankası tarafından sağlanan küresel veri setleri.
- Yelp Open Dataset: Yelp tarafından sağlanan işletmeler ve değerlendirmeleri ile ilgili açık veri seti.
- Zillow Economic Data: Gayrimenkul ekonomisi ile ilgili veri setleri.
- Academic Torrents: Academic Torrents
- Google Scholar Datasets: Google Scholar Datasets
- Data.gov.uk: Data.gov.uk
- World Economic Forum (WEF) Data: World Economic Forum Data
- Our World in Data: Our World in Data
- The Guardian Datablog: The Guardian Datablog
- US Government Open Data: Data.gov
- OECD Data: OECD Data
- World Trade Organization (WTO) Data: WTO Data
- United Nations Comtrade Database: UN Comtrade Database
- World Tourism Organization (UNWTO) Data: UNWTO Data
- OECD Health Data: OECD Health Data
- U.S. Energy Information Administration (EIA) Data: EIA Data
- U.S. Federal Data Catalog: Data.gov
- International Monetary Fund (IMF) Data: IMF Data
- National Bureau of Economic Research (NBER) Databases: NBER Databases
- Federal Reserve Economic Data (FRED): FRED
- Gapminder: Gapminder
- ProPublica Data Store: ProPublica Data Store
- Biodiversity Heritage Library: Biodiversity Heritage Library
Bu veri kaynaklarını kullanarak geliştirebileceğiniz veri bilimi projeleri:
- İklim ve Çevre Analizi:
- NOAA ve diğer çevresel veri setleri kullanılarak iklim değişikliği analizi.
- Hava durumu verileri üzerinde zaman serisi analizi.
- Ekonomik Analiz:
- Dünya Bankası, IMF ve FED verileriyle ekonomik göstergelerin analizi.
- Ticaret verileri üzerinde ekonomik ilişkilerin incelenmesi.
- Sağlık Analizi:
- GBD Study ve OECD Health Data ile hastalık yükü analizi.
- Pandemi süreçlerindeki verilerle sağlık krizlerinin analizi.
- Enerji ve Çevre:
- Yenilenebilir enerji verileri üzerinde analizler.
- Enerji tüketimi ve çevresel etkiler üzerine çalışmalar.
- Sosyal Analiz:
- UNICEF ve diğer sosyal veri setleriyle çocuklarla ilgili sosyal analizler.
- GAPMINDER verileriyle küresel sosyal ekonomik analizler.
- Medya ve Gazetecilik:
- The Guardian Datablog ve ProPublica verileriyle gazetecilik odaklı analizler.
- Google Books Ngrams ile dil ve kültür analizi.
- Ulaşım ve Mobilite:
- Bisiklet paylaşım sistemleri ve diğer ulaşım verileri üzerinde analizler.
- Havacılık verileriyle seyahat eğilimlerinin incelenmesi.
- Eğitim Analizi:
- Google Scholar Datasets ve akademik veri setleri ile bilimsel yayın analizi.
- OECD verileriyle eğitim sistemi performans analizi.
- Biyoloji ve Genetik:
- Kanser genomi verileri üzerinde analizler (NCI Genomic Data Commons).
- Biyolojik çeşitlilik verileri ile ekosistem analizi (Biodiversity Heritage Library).
- Kültürel Analiz:
- Müzik verileriyle müzik tüketim alışkanlıklarının analizi.
- Film ve televizyon verileri üzerinde kültürel analizler (TMDb).
- Turizm ve Seyahat Analizi:
- UNWTO ve diğer turizm verileri kullanılarak turizm eğilimlerinin analizi.
- Ülkeler arası turist hareketleri ve seyahat alışkanlıkları üzerine analizler.
- Bilim ve Teknoloji İncelemesi:
- NASA ve diğer uzay ajanslarının verileriyle uzay keşifleri ve bilimsel araştırmaların analizi.
- Akademik yayınlarla ilgili bibliyometrik analizler (Google Scholar Datasets).
- Tarım ve Gıda Güvenliği:
- USDA Economic Research Service verileri üzerinde tarım ve gıda ekonomisi analizi.
- Küresel gıda üretimi ve tüketimi üzerine çalışmalar.
- Geliştirici Yetenekleri ve İş Trendleri:
- HackerRank Developer Skills Report ve diğer iş trend verileriyle yazılım geliştirici yeteneklerinin analizi.
- İş dünyasındaki teknoloji trendleri üzerine analizler.
- Sosyal Güvenlik ve Popüler İsim Analizi:
- SSA Data ile sosyal güvenlik numaraları ve popüler isimler üzerine analizler.
- İsim eğilimleri ve kültürel değişimlerin analizi.
- Mental Sağlık ve Nörobilim:
- NIMH Data Archive verileriyle ruhsal sağlık ve nörobilim analizleri.
- Mental sağlık ile ilgili küresel eğilimlerin incelenmesi.
- E-Spor ve Oyun Analizi:
- Oyun verileri üzerinde analizler (örneğin, TMDb API ve diğer oyun veritabanları).
- E-spor turnuvaları ve oyuncu performansı üzerine çalışmalar.
- UFO Gözlemleri Analizi:
- NUFORC Databases ile UFO gözlemleri üzerine coğrafi ve zaman serisi analizleri.
- Potansiyel UFO olaylarının modellenmesi.
- Çocuk Büyüme ve Beslenme Analizi:
- Global Database on Child Growth and Malnutrition verileriyle çocuk büyüme ve beslenme analizleri.
- Küresel çocuk sağlığı eğilimlerinin incelenmesi.
- Geniş Ağ Analizi:
- SNAP veri setleri ile büyük ölçekli ağ analizi ve sosyal medya etkileşimlerinin analizi.
- İnternet üzerindeki bağlantılar ve etkileşimler üzerine analizler.
Bu çeşitli ve kapsamlı veri setleri, veri bilimi projeleri için zengin bir kaynak sunmaktadır. İlgilendiğiniz konuya bağlı olarak, turizm analizinden uzay keşiflerine, gıda güvenliğinden yazılım geliştirici yeteneklerine kadar geniş bir yelpazede proje fırsatları bulunmaktadır. Bu veri setlerini kullanarak gerçekleştireceğiniz projeler, veri bilimi becerilerinizi geliştirmenize ve derinlemesine anlayış kazanmanıza olanak tanıyacaktır.