• 仅20行代码,实现文件自动化上传至sftp

仅20行代码,实现文件自动化上传至sftp

2025-04-27 11:13:13 栏目:宝塔面板 137 阅读

1. 背景

最近接到一个产品需求是给指定的 sftp 服务器的指定目录定时推送文件数据。

因为项目组已有现成的组件可以轻松实现 sftp 服务器文件的快速上传,本来是一件很容易的事情,但是问题出现在这个指定的 sftp 服务器所指定的密码带有系统关键字和一些特殊字符,导致现在的组件在解析过程中会失败。

因此重新开发了下面的这套脚本来满足这个特殊的需求。

2. 代码实现

Python代码

#test_upload.py
import os, sys
import yaml
from optparse import OptionParser
import paramiko
import traceback


opt_parser = OptionParser()
opt_parser.add_option('--node', action='store', type='string', dest='node', help='sftp config')
opt_parser.add_option('--local_file', action='store', type='string', dest='local_file', help='file to be transferred')


def load_config_from_param_conf(key):
"""
:param key: 指定业务所使用的sftp服务的名称,例如sftp.yaml文件中的key: test_file_upload
:return: 从指定路径拿到yaml文件并读取指定key,返回例如sftp.yaml文件中key为test_file_upload下的配置选项值
包含: host,port,user,password,destination
"""
config_file = f'{os.environ["TASK_MAIN"]}/test_conf/sftp.yaml' #获取指定路径下的yaml文件
with open(config_file, 'r') as r: #打开yaml文件内容
config = yaml.load(r) #转换yaml数据为字典
return config['sftp']['upload'][key]


def upload(sftp_conf, local_file_path):
"""
:param sftp_conf: 获取指定sftp_conf=test_file_upload下返回的字典值,这里的参数sftp_conf与load_config_from_param_conf函数里的参数值一致
:param local_file_path: 指定本地要上传到sftp服务器的文件的绝对路径
:return:
"""
sf = paramiko.Transport((sftp_conf['host'], sftp_conf['port']))
sf.connect(username=sftp_conf['user'], password=sftp_conf['password'])
sftp = paramiko.SFTPClient.from_transport(sf)
to_path = sftp_conf['destination']
sftp.put(local_file_path, to_path + os.sep + os.path.split(local_file_path)[-1], confirm=False)
sftp.close()


if __name__ == '__main__':
option = opt_parser.parse_args(sys.argv[1:])[0]
sftp_conf = load_config_from_param_conf(option.node)
try:
upload(sftp_conf, option.local_file)
except Exception as e:
print(traceback.format_exc())
raise Exception('upload {} file error.'.format(option.local_file))

sftp配置文件代码

#sftp.yaml
sftp:
upload:
test_file_upload:
host: 10.12.34.6
port: 808
user: user_test
password: 8Z.Lx/2@UH
destination: /data/dump

3. 代码分析

(1). yaml 模块

import yaml

导入 yaml 模块前可以使用以下命令进行模块的安装

python3 -m pip install PyYaml

yaml 模块在这里的作用是读取 sftp 配置文件代码,将指定key: test_file_upload 下的 key:value 的值转换为字典。

例如:load_config_from_param_conf 函数中的返回值就是使用 yaml 读取到 sftp 配置文件代码后,返回 key: test_file_upload 下配置选项值。

格式如下:

{ "host": "10.12.34.6",
"port": "808",
"user": "user_test",
"password": "8Z.Lx/2@UH",
"destination": "/data/dump"
}

最后将返回值传给 upload 函数作为参数。

(2). OptionParser 模块

from optparse import OptionParser

按照 yaml 模块的安装方法,先安装 optparse 模块后,然后在文件中从optparse 中导入 OptionParser 模块

opt_parser = OptionParser()
opt_parser.add_option('--node', action='store', type='string', dest='node', help='sftp config')
opt_parser.add_option('--local_file', action='store', type='string', dest='local_file', help='file to be uploaded')

在这里我使用了 OptionParser 这个类实例化了一个对象:opt_parser,通过对象来调用 add_option 方法添加了2个参数,分别是:node, local_file

1). 形参:--node,实参:node

所代表的业务含义是:指定要上传的 sftp 的节点,具体参数值对应 sftp配置文件代码中的 test_file_upload

2). 形参:--local_file,实参:local_file

所代表的业务含义是:指定本地需要被上传到 sftp 服务器的具体文件路径

3). 调用命令

python3 test_upload.py --node test_file_upload --local_file 
/home/test/sftp_load/test_001.csv

4). add_option()方法

add_option()参数说明:

  • action: 存储方式,分别为:store,store_false,store_true
  • type: 类型
  • dest: 存储的变量
  • default: 默认值
  • help: 帮助信息

参数:action的枚举

  • store: 参数列表中带有--node, 那么就会将下一个元素即:test_file_upload 作为其 dest 实参 node 的值; 如果没有--node,那么对应的node的值就为 None;
  • store_true: 参数列表中有--local_file, 那么其 dest 实参 local_file 的值就为 True; 否者就为 default 定义的默认值,这里没有给定 default 的默认值;
  • store_false: 参数列表中有--local_file, 那么其 dest 实参 local_file 的值就为 False; 否者就为 default 定义的默认值,这里没有给定 default 的默认值;

参数:type

type是指定传入参数的类型,这里的参数类型为 string 类型。

参数:dest

dest是参数传入后由哪个变量来存储的,后面代码对该参数的引用也是使用这里定义的变量名来引用的。

参数:default

default 是与 action 的值结合使用的。

  • 当action=store_true时,default=123时,如果有传入形参--local_file,则实参local_file的值为:True
  • 当action=store_true时,default=123时,如果没有传入形参--local_file,则实参local_file的值为:123
  • 当action=store_false时,default=123时,如果有传入形参--local_file,则实参local_file的值为:False
  • 当action=store_false时,default=123时,如果没有传入形参--local_file,则实参local_file的值为:123

参数:help

help相当于帮助说明文档,用于描述这个参数的含义。

本文地址:https://www.yitenyun.com/159.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 服务器 管理口 HexHub Docker JumpServer SSL 堡垒机 跳板机 HTTPS 服务器性能 JumpServer安装 堡垒机安装 Linux安装JumpServer SQL 查询 生命周期 Deepseek 宝塔面板 Linux宝塔 锁机制 esxi esxi6 root密码不对 无法登录 web无法登录 行业 趋势 序列 核心机制 Windows Windows server net3.5 .NET 安装出错 HTTPS加密 开源 PostgreSQL 存储引擎 宝塔面板打不开 宝塔面板无法访问 Windows宝塔 Mysql重置密码 机器学习 Redis 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 Undo Log 机制 响应模型 Spring 动态查询 Oracle 处理机制 InnoDB 数据库锁 优化 万能公式 连接控制 group by 索引 Serverless 无服务器 语言 监控 无法访问宝塔面板 异步化 ES 协同 Postgres OTel Iceberg 工具 openHalo scp Linux的scp怎么用 scp上传 scp下载 scp命令 技术 缓存方案 缓存架构 缓存穿透 国产数据库 高可用 分页查询 数据 主库 SVM Embedding Linux 安全 SQLite-Web SQLite 数据库管理工具 Netstat Linux 服务器 端口 存储 GreatSQL 连接数 云原生 加密 场景 R edis 线程 Recursive R2DBC 防火墙 黑客 启动故障 SQLark OB 单机版 向量数据库 大模型 共享锁 日志文件 MIXED 3 ​Redis 推荐模型 Canal AI 助手 RocketMQ 长轮询 配置 信息化 智能运维 自定义序列化 PG DBA 不宕机 Python 传统数据库 向量化 向量库 Milvus 业务 同城 双活 Web 接口 开发 聚簇 非聚簇 Ftp 电商 系统 线上 库存 预扣 修改DNS Centos7如何修改DNS IT运维 Hash 字段 架构 filelock Rsync 数据类型 分库 分表 MySQL 9.3 磁盘架构 缓存 sftp 服务器 参数 mini-redis INCR指令 MongoDB 数据结构 redo log 重做日志 数据分类 MCP 开放协议 语句 PostGIS 频繁 Codis • 索引 • 数据库 ZODB Doris SeaTunnel 流量 窗口 函数 分布式架构 分布式锁​ MVCC Go 数据库迁移 数据备份 虚拟服务器 虚拟机 内存 工具链 Redisson 锁芯 失效 人工智能 推荐系统 EasyExcel MySQL8 主从复制 代理 prometheus Alert MGR 分布式集群 分页 千万级 大表 聚簇索引 非聚簇索引 高效统计 今天这篇文章就跟大家 网络故障 播客 StarRocks 数据仓库 网络架构 网络配置 引擎 性能 INSERT 崖山 新版本 COMPACT 事务 Java 数据集成工具 发件箱模式 容器 核心架构 订阅机制 QPS 高并发 Entity SSH Redka Weaviate RDB AOF 关系数据库 Web B+Tree ID 字段 数据页 速度 服务器中毒 Caffeine CP 数据脱敏 加密算法 Valkey Valkey8.0 DBMS 管理系统 分布式 集中式 OAuth2 Token Redis 8.0 容器化 自动重启 SpringAI 微软 SQL Server AI功能 读写 LRU 模型 原子性 排行榜 排序 池化技术 连接池 数据字典 兼容性 JOIN 意向锁 记录锁 事务隔离 dbt 数据转换工具 业务场景 Testcloud 云端自动化 单点故障 UUID ID 分页方案 排版 部署 日志 1 ReadView 优化器 Pottery InfluxDB 悲观锁 乐观锁 网络 事务同步 UUIDv7 主键 sqlmock 分布式锁 Zookeeper AIOPS 对象 双引擎 RAG HelixDB 产业链 Order 编程 仪表盘 字典 Ansible Pump 单线程 拦截器 动态代理 恢复数据 Crash 代码 线程安全 国产 用户 快照读 当前读 视图 LLM IT 订单 List 类型 慢SQL优化 count(*) count(主键) 行数 表空间 RR 互联网 神经系统 解锁 调优 Next-Key 矢量存储 数据库类型 AI代理 CAS 查询规划 多线程 GitHub Git 算法 技巧 并发控制 恢复机制 闪回