Zyte API Training Workshop

A comprehensive workshop for learning web scraping using Zyte API and Cursor IDE. This repository contains examples, exercises, and solutions for various web scraping scenarios.

🎯 Workshop Overview

Learn to build robust web scrapers using Zyte API, handling different scraping scenarios:

Network traffic capture and API analysis
Classic pagination handling
Infinite scroll management
Form submission and interaction
Error handling and best practices

🚀 Getting Started

Prerequisites

Python 3.8 or higher
Zyte API account and API key
Basic understanding of Python and web scraping concepts

Installation

Clone the repository:

git clone https://github.com/NehaSetia-DA/zyte-api-training
cd zyte-api-training

Create and activate virtual environment:

# Create virtual environment
python -m venv .venv

# Activate virtual environment
# On Windows:
.venv\Scripts\activate
# On macOS/Linux:
source .venv/bin/activate

Install dependencies:

pip install -r requirements.txt

Configure environment:

# Create .env file
cp .env.example .env

# Add your Zyte API key to .env
echo "ZYTE_API_KEY=your-api-key-here" > .env

Verify setup:

python check_setup.py

📁 Repository Structure

Examples

Ready-to-use example implementations:

01_network_capture.py - Network traffic capture and analysis
02_pagination_classic.py - Classic pagination handling
03_pagination_infinite.py - Infinite scroll implementation
04_form_submission.py - Form handling and submission
basic-extraction.py - Basic data extraction

Exercises

Practice exercises with increasing complexity:

01_network_capture.py - Nike product data extraction
02_pagination_classic.py - Job listings scraper
03_infinite_scroll.py - Nike Product Extraction using Infinite scroll actions Zyte API.
04_form_submission.py - Quote search form automation
practice_scenarios.py - Additional challenges

Solutions

Complete implementations of exercises with best practices:

Error handling
Rate limiting
Data validation
Optimal performance

Utils

Helper functions and configurations:

API configuration
Common utilities
Shared functions

🎓 Workshop Content

1. Network Capture (Nike Case Study)

Capturing API endpoints
Analyzing network traffic
Extracting product data
Handling pagination

2. Classic Pagination (Indeed.com)

Page-by-page navigation
Data extraction
Error handling
Rate limiting

3. Infinite Scroll (Nike Search)

Dynamic content loading
Scroll management
Duplicate detection
Performance optimization

4. Form Submission (Quotes to Scrape)

Form interaction
Multi-step processes
Response validation
Error recovery

💡 Best Practices

Rate Limiting
- Implement delays between requests
- Use exponential backoff
- Handle API limits
Error Handling
- Try-except blocks
- Retry mechanisms
- Logging and monitoring
Data Management
- Proper storage formats
- Data validation
- Duplicate handling
Code Organization
- Modular structure
- Clear documentation
- Reusable components

🛠️ Tools Used

Zyte API - All in one Web Scraping API.
Cursor IDE - AI-powered development environment

📚 Additional Resources

Zyte API Documentation

Getting Started Guide - Complete overview and usage guide
API Usage Examples - Common usage patterns and examples
HTTP Mode - HTTP request handling
Browser Automation Mode - Browser automation features
Browser Actions - Available browser interactions
Extraction API - Data extraction capabilities
Proxy Mode - Proxy configuration and usage

🤝 Contributing

Feel free to:

Report issues
Suggest improvements
Submit pull requests

📝 License

This project is licensed under the MIT License - see the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
examples		examples
exercises		exercises
solutions		solutions
utils		utils
.gitignore		.gitignore
README.md		README.md
Zyte API Training Sessions.code-workspace		Zyte API Training Sessions.code-workspace
check_setup.py		check_setup.py
requirements.txt		requirements.txt
system_architecture.md		system_architecture.md
test_examples.py		test_examples.py
workshop_plan.md		workshop_plan.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Zyte API Training Workshop

🎯 Workshop Overview

🚀 Getting Started

Prerequisites

Installation

📁 Repository Structure

Examples

Exercises

Solutions

Utils

🎓 Workshop Content

1. Network Capture (Nike Case Study)

2. Classic Pagination (Indeed.com)

3. Infinite Scroll (Nike Search)

4. Form Submission (Quotes to Scrape)

💡 Best Practices

🛠️ Tools Used

📚 Additional Resources

Zyte API Documentation

🤝 Contributing

📝 License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Zyte API Training Workshop

🎯 Workshop Overview

🚀 Getting Started

Prerequisites

Installation

📁 Repository Structure

Examples

Exercises

Solutions

Utils

🎓 Workshop Content

1. Network Capture (Nike Case Study)

2. Classic Pagination (Indeed.com)

3. Infinite Scroll (Nike Search)

4. Form Submission (Quotes to Scrape)

💡 Best Practices

🛠️ Tools Used

📚 Additional Resources

Zyte API Documentation

🤝 Contributing

📝 License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages