使用 Python 解析配置文件

开发 后端
有几种流行的配置文件格式。其中包括古老的(虽然有时定义不明确)INI 格式,虽然流行但有时难以手写的 JSON 格式,使用广泛但有时在细节方面令人意外的 YAML 格式,以及很多人还没有听说过的最新出现的 TOML。

[[409306]]

第一步是选择配置文件的格式:INI、JSON、YAML 或 TOML。

有时,程序需要足够的参数,将它们全部作为命令行参数或环境变量既不让人愉快也不可行。 在这些情况下,你将需要使用配置文件。

有几种流行的配置文件格式。其中包括古老的(虽然有时定义不明确)INI 格式,虽然流行但有时难以手写的 JSON 格式,使用广泛但有时在细节方面令人意外的 YAML 格式,以及很多人还没有听说过的最新出现的 TOML。

你的首要任务是选择一种格式,然后记录该选择。解决了这个简单的部分之后就是时候解析配置了。

有时,在配置中拥有一个与“抽象“数据相对应的类是一个不错的想法。因为这段代码不会对配置做任何事情,所以这是展示解析逻辑最简单的方式。

想象一下文件处理器的配置:它包括一个输入目录、一个输出目录和要提取的文件。

配置类的抽象定义可能类似于:

  1. from __future__ import annotations
  1. import attr
  2.  
  3. @attr.frozen
  4. class Configuration:
  5. @attr.frozen
  6. class Files:
  7. input_dir: str
  8. output_dir: str
  9. files: Files
  10. @attr.frozen
  11. class Parameters:
  12. patterns: List[str]
  13. parameters: Parameters

为了使特定于格式的代码更简单,你还需要编写一个函数来从字典中解析此类。请注意,这假设配置将使用破折号,而不是下划线。 这种差异并不少见。

  1. def configuration_from_dict(details):
  2. files = Configuration.Files(
  3. input_dir=details["files"]["input-dir"],
  4. output_dir=details["files"]["output-dir"],
  5. )
  6. parameters = Configuration.Paraneters(
  7. patterns=details["parameters"]["patterns"]
  8. )
  9. return Configuration(
  10. files=files,
  11. parameters=parameters,
  12. )

JSON

JSON(JavaScript Object Notation)是一种类似于 JavaScript 的格式。

以下是 JSON 格式的示例配置:

  1. json_config = """
  2. {
  3. "files": {
  4. "input-dir": "inputs",
  5. "output-dir": "outputs"
  6. },
  7. "parameters": {
  8. "patterns": [
  9. "*.txt",
  10. "*.md"
  11. ]
  12. }
  13. }
  14. """

解析逻辑使用 json 模块将 JSON 解析为 Python 的内置数据结构(字典、列表、字符串),然后从字典中创建类:

  1. import json
  2. def configuration_from_json(data):
  3. parsed = json.loads(data)
  4. return configuration_from_dict(parsed)

INI

INI 格式,最初只在 Windows 上流行,之后成为配置标准格式。

这是与 INI 相同的配置:

  1. ini_config="""
  2. [files]
  3. input-dir = inputs
  4. output-dir = outputs
  5.  
  6. [parameters]
  7. patterns = ['*.txt', '*.md']
  8. """

Python 可以使用内置的 configparser 模块解析它。解析器充当类似 dict 的对象,因此可以直接传递给 configuration_from_dict

  1. import configparser
  2.  
  3. def configuration_from_ini(data):
  4. parser = configparser.ConfigParser()
  5. parser.read_string(data)
  6. return configuration_from_dict(parser)

YAML

YAML(Yet Another Markup Language)是 JSON 的扩展,旨在更易于手动编写。为了实现了这一点,部分原因是有一个很长的规范。

以下是 YAML 中的相同配置:

  1. yaml_config = """
  2. files:
  3. input-dir: inputs
  4. output-dir: outputs
  5. parameters:
  6. patterns:
  7. - '*.txt'
  8. - '*.md'
  9. """

要让 Python 解析它,你需要安装第三方模块。最受欢迎的是PyYAMLpip install pyyaml)。 YAML 解析器还返回可以传递给 configuration_from_dict 的内置 Python 数据类型。但是,YAML 解析器需要一个字节流,因此你需要将字符串转换为字节流。

  1. import io
  2. import yaml
  3. def configuration_from_yaml(data):
  4. fp = io.StringIO(data)
  5. parsed = yaml.safe_load(fp)
  6. return configuration_from_dict(parsed)

TOML

TOML(Tom's Own Markup Language)旨在成为 YAML 的轻量级替代品。其规范比较短,已经在一些地方流行了(比如 Rust 的包管理器 Cargo 就用它来进行包配置)。

这是与 TOML 相同的配置:

  1. toml_config = """
  2. [files]
  3. input-dir = "inputs"
  4. output-dir = "outputs"
  5.  
  6. [parameters]
  7. patterns = [ "*.txt", "*.md",]
  8. """

为了解析 TOML,你需要安装第三方包。最流行的一种被简单地称为 toml。 与 YAML 和 JSON 一样,它返回基本的 Python 数据类型。

  1. import toml
  2. def configuration_from_toml(data):
  3. parsed = toml.loads(data)
  4. return configuration_from_dict(parsed)

总结

选择配置格式是一种微妙的权衡。但是,一旦你做出决定,Python 就可以使用少量代码来解析大多数流行的格式。 

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2010-02-03 09:19:31

Python模块

2022-11-10 09:05:18

Lua配置文件

2010-03-18 18:17:01

Python 配置文件

2011-03-28 09:07:26

Nagios配置文件

2010-02-22 10:18:18

WCF配置文件

2021-07-13 05:47:40

GroovyJSON软件开发

2010-12-27 14:59:31

Outlook 配置文

2010-03-19 11:18:07

Python读写配置文

2011-09-08 16:07:13

Widget配置文件

2009-12-21 11:19:50

WCF配置文件

2009-11-05 10:30:41

WCF Address

2021-07-08 21:19:04

BashLinux

2020-10-20 10:12:00

Windows

2019-11-22 10:00:53

ICC配置文件Windows 10

2009-06-08 16:44:00

Struts配置文件

2011-01-13 16:27:26

Linux配置文件

2011-01-19 14:00:21

2010-12-28 16:35:32

Outlook 配置文

2010-02-02 18:19:52

Linux mplay

2009-06-17 14:10:30

Spring配置文件
点赞
收藏

51CTO技术栈公众号