使用Python实现网页中图片的批量下载和水印添加保存-阿里云开发者社区

使用Python实现网页中图片的批量下载和水印添加保存

2023-10-12 929

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云原生数据库 PolarDB MySQL 版，Serverless 5000PCU 100GB

云数据库 Redis 版，社区版 2GB

简介： 使用Python实现网页中图片的批量下载和水印添加保存

数字时代，图片已经成为我们生活中的一部分。无论是社交媒体上的照片，还是网页中的图片元素，我们都希望能够方便地下载并进行个性化的处理。
假设你是一位设计师，你经常需要从网页上下载大量的图片素材，并为这些图片添加水印以保护你的作品。然而，手动下载和添加水印是一件繁琐的事情，这时就可以通过编写一个Python爬虫程序，自动化地完成这个任务，节省时间和精力。
我们的基本思路是通过发送HTTP请求获取网页内容，然后解析网页内容，提取出图片元素的URL。接下来，我们使用请求库下载这些图片，并使用Pillow库添加水印。最后，我们将处理后面的图片保存到本地。
在开始之前，我们需要准备以下工作：
1安装Python：确保您的计算机上已经安装了Python Spark语言的最新版本。
2安装所需的库：我们将使用requests库来发送HTTP请求，PIL库来处理图片。你可以使用以下命令来安装这些库：

pip install requests
pip install pillow

接下来，我们可以定义一个函数来发送HTTP请求并获取页面内容：

def fetch_page(url):
    proxies = {
        "http": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}",
        "https": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}"
    }
    response = requests.get(url, proxies=proxies)
    return response.content

然后，我们可以编写一个函数来解析页面内容并提取图片元素的URL：

from bs4 import BeautifulSoup
def extract_image_urls(page_content):
    soup = BeautifulSoup(page_content, "html.parser")
    image_urls = []
    for img in soup.find_all("img"):
        image_urls.append(img["src"])
    return image_urls

接下来，我们可以编写一个函数来下载图片并添加水印：

def download_and_add_watermark(image_url):
    response = requests.get(image_url)
    image = Image.open(BytesIO(response.content))
    watermark = Image.new("RGBA", image.size, (0, 0, 0, 0))
    draw = ImageDraw.Draw(watermark)
    font = ImageFont.truetype("arial.ttf", 36)
    draw.text((10, 10), "Watermark", font=font, fill=(255, 255, 255, 128))
    watermarked_image = Image.alpha_composite(image.convert("RGBA"), watermark)
    watermarked_image.save("watermarked_image.png")

实现完整代码

以下是完整的Python代码：

import requests
from bs4 import BeautifulSoup
from PIL import Image, ImageDraw, ImageFont
from io import BytesIO
proxyHost = "www.16yun.cn"
proxyPort = "5445"
proxyUser = "16QMSOML"
proxyPass = "280651"
def fetch_page(url):
    proxies = {
        "http": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}",
        "https": f"http://{proxyUser}:{proxyPass}@{proxyHost}:{proxyPort}"
    }
    response = requests.get(url, proxies=proxies)
    return response.content
def extract_image_urls(page_content):
    soup = BeautifulSoup(page_content, "html.parser")
    image_urls = []
    for img in soup.find_all("img"):
        image_urls.append(img["src"])
    return image_urls
def download_and_add_watermark(image_url):
    response = requests.get(image_url)
    image = Image.open(BytesIO(response.content))
    watermark = Image.new("RGBA", image.size, (0, 0, 0, 0))
    draw = ImageDraw.Draw(watermark)
    font = ImageFont.truetype("arial.ttf", 36)
    draw.text((10, 10), "Watermark", font=font, fill=(255, 255, 255, 128))
    watermarked_image = Image.alpha_composite(image.convert("RGBA"), watermark)
    watermarked_image.save("watermarked_image.png")
def main():
    # 获取网页的页面内容
    page_content = fetch_page("https://www.58pic.com/")
    # 提取图片元素的URL
    image_urls = extract_image_urls(page_content)
    # 下载图片并添加水印
    for image_url in

使用Python实现网页中图片的批量下载和水印添加保存

数据库

热门文章

最新文章

相关课程

相关电子书

相关实验场景