Python Scrapy ile Web Scraping – Web Kazıma Temeller

Veri aslında insanlık tarihi kadar eski bir kavram.

5 duyumuz aslında birer sensör ve bu sensörlerden beynimize gelen uyarıcılar veri değil de nedir?

Günümüzde veri ve veri bilimi spesifik bir alan olsa gibi gözükse de, ‘veri’ teriminin bu genel kapsamını bilmek, bugün veri biliminin geldiği noktayı anlamak ve geleceğini tahmin edebilmek için önemli.

Veri Bilimi, bu genel bakıştan hareketle, ‘veri’den ‘fayda’ elde eden bir alan olarak görülebilir.

İşte bu alanda herşey tabii ki ‘veri’ ile başlıyor…

Google’ın en sofisitike algoritmaları ile koşturduğu süper makinelerin başlangıç noktası: Veri.

Veri Biliminde, aslında algoritmanız kadar değil veriniz kadar güçlüsünüz.

Çünkü standart algoritmanız belki %70 doğrulukla tahmin eder, Google süper makineleri belki %85.

Burada kritik nokta, atılım yapacağınız nokta, fark yaratacağınız nokta ‘süper metedolojiniz’ veya ‘süper makina’nız değil; ‘fayda’ sağlama adına gerekirse kendinizin tanımladığı ve hatta elleri ile topladığı ‘veri’. Çünkü özgün bir veri ile çözececeğiniz özgün bir problem, bu alana gerçek anlamda bir katkı yapacaktır.

İşte bu ders, veri biliminin olmazsa olmazı, varlık sebebi ‘veri’ üzerine.

Ve sınırsız verinin bulunduğu internet ortamından veri çekme üzerine.

Özgün veri elde etme ve gerçek problemler çözme adına tek kaynağınız.

Çünkü unutmayın, kaggle’dan elde ettiğiniz veri herkesteki veridir, onunla büyük ihtimalle herkesin çözdüğü problemleri belki çözebilirsiniz, şansınız yaver giderse.

Fakat internet ortamında veri çekme yeteneği kazanırsanız, bu yeteneği gerçek anlamda kullanacak seviyeye gelirseniz, elde edebileceğiniz veri ve bu veri ile çözmeyi deneyebileceğiniz gerçek problemlerin sınırı yok.

Evet bu ders, internetten veri çekme kapsamında kullabileceğiniz en ‘intuitive’: anlaşılır dil olan Python’un, bu alandaki en gelişmiş ‘framework’u, Scrapy için güçlü bir giriş.

Web Scraping dünyasına gerçek ve pratik bir girizgah.

Yaklaşık 150 ülkeden 15000 öğrenciye verdiğim Web Scraping derslerinden biri olan: Fundamentals kursunun genişletilmiş ve özel hazırlanmış Türkçe versiyonu. Ücretsiz.

Artık bahaneniz kalmadı.

Bu derste, web kazıma yeteneğinin ne anlama geldiğine bir giriş yaptıktan sonra, bu yeteneğin uygulama alanı olan internet ve request-response cycle (istek-cevap çevrimi) üzerinde duracağız.

Bu çevrimi anladıktan sonra, Scrapy Spider nesnelerini kullanarak, 3 temel basamakta, nasıl web kazıma yapıldığını, amazon web sitesi örneği üzerinden en pratik şekilde uygulayacağız…

Nesne Tabanlı Programlama, Python bilginiz var; Web Scraping – Web Kazıma dünyasına Scrapy Spider nesneleri ile pratik ve gerçek bir adım atmak istiyorsanız, doğru yerdesiniz. Hemen başlayın. Çok değil 2 saat içinde bulunduğunuz noktaya inanamayacaksınız.

Ders UDEMY platformunda. UDEMY’de ücretsiz derslerin maksimum uzunluğu 2 saat ile sınırlandırıldı. Bu nedenle, Web Kazımaya Giriş Bölümünü buraya aldım.

Birinci bölümü kapsayan bu sayfadaki videoları izledikten sonra, bu linkten, UDEMY: Python Scrapy ile Web Scraping – Web Kazıma Temeller, dersine gidebilir. Oradan devam edebilirsiniz.

UDEMY platformunda görüşmek üzere, Başarılar…

İlk Ders
Web Scraping – Web Kazıma Giriş
Scrapy Framework Giriş
Neden Web Scraping?
Request – Response Döngüsü WWW

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s