光溯星河

公网安备案小记

Fri, 26 Jul 2024 08:58:00 GMT

快速链接：

公安备案的效率还是很高的，整体流程体验也很好。但是大家一定要多看看指引再动手，避免走弯路浪费时间。我正确提交申请并通过的时间事实上也就一天，加上主体申请，两天就能完事。去年我曾经吐槽过网安备案上传身份证图片还需要flash，不过没过多久公安部网上办事平台便更新了，非常好使，好评。

在备案过程中我们需要着重关注开办主体和网站信息两个部分，参考对应服务商指导文档填写信息。在这里将我遇到的一些问题列举出来共大家参考：

建议选择户籍所在地网安大队进行备案；
博客网站备案“是否提供互联网交互服务”选项应选择否，我第一次申请填了是，得到的批复是“审核不通过，非论坛类网站请提交非交互式。”；
域名证书可以在域名注册商处下载；
腾讯云的“网站接入服务商”应填写：北京市/市辖区/海淀区-腾讯云计算（北京）有限责任公司-租赁主机；
DNSPod的“域名接入服务商”应填写：山东省/烟台市/开发区-烟台帝思普网络科技有限公司；
如果备案了需要交互服务的论坛网站，应填写安全评估申请，并下载签字后提交；
当然，申请通过后也别忘了正确悬挂备案号并链接到备案官网。

参考阅读

通用唯一识别码UUID小记

Thu, 25 Jul 2024 04:53:00 GMT

在软件开发、数据库管理和分布式系统中，唯一标识符（Unique Identifier）是一个至关重要的概念。我们常常会为实体设计唯一的ID，以保证其在系统中的唯一性，避免实体冲突。自增ID、UUID等唯一标识符便在这样的需求下应运而生。

什么是UUID?

UUID（Universally Unique Identifier, 通用唯一识别码）由RFC 4122定义，技术上等同于 ITU-T Rec. X.667 | ISO/IEC 9834-8，最早由开放软件基金会标准化。

标准格式

UUID 的 16 个 8 位字节表示为 32 个十六进制数字，由连字符 '-' 分隔成五组显示，形式为“8-4-4-4-12”总共 36 个字符（32 个十六进制数字和 4 个连字符）。

UUID要求以小写形式生成字符，同时对输入不区分大小写。
形如：xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx

名称	字节	字长（16进制数字码长）	说明
time_low	4	8	整数：低位 32 bits 时间戳
time_mid	2	4	整数：中间位 16 bits 时间戳
time_hi_and_version	2	4	最高有效位中的 4 bits“版本”(`Mxxx`)，后面是高 12 bits 的时间戳
clock_seq_hi_and_res clock_seq_low	2	4	最高有效位为 1-3 bits“变体”(`Nxxx`)，后跟13-15 bits 时钟序列
node	6	12	48 bits 节点 ID

我们重点关注其中的版本和变体。

变体 variant

变体（variant）字段占位1~3bit，RFC 4122共规定了4种变体。（x代表位置没有意义）

变体 0 (形如0xxx), 用于向后兼容已经过时的1988年开发的 Apollo 网络计算系统（NCS）1.5 UUID 格式；
变体 1 (形如10xx), 按照大端序作为二进制存储与传输，RFC称“保留，微软公司向后兼容；
变体 2 (形如110x), 按照小端序作为二进制存储与传输；
变体 3 (形如111x), 保留未使用。

在RFC 4122中，我们实际关注的是变体1（10xx）这一类别，所以我们在变体（Nxxx）这一字段事实上只能见到四个值：

版本 version

版本可以理解为变体下不同的子类型，RFC 4122中定义了五个版本，版本（Mxxx）取值为1/2/3/4/5.

版本1 日期时间和MAC地址

时间戳版本，60-bit 的时间戳和节点的48-bit MAC地址而生成的；
- 优点：基于时间戳和MAC地址生成，保证了UUID唯一性；
- 缺点：有暴露节点MAC隐私信息的风险

版本2 日期时间和DCE标识符

在版本1的基础上使用"DCE安全标识符"
- 优点：替换掉了MAC地址，解决了暴露计算机隐私信息的问题；
- 缺点：DCE实现在RFC 4122中未提及，标识符对生成速率有影响

版本3/5 散列命名空间

通过将命名空间（例如域名）和一个名字组合并生成哈希值来创建UUID。任何所需的UUID都可以用作命名空间指示符。
- 版本3 - MD5
- 版本5 - SHA1

版本4 随机

一个随机或伪随机生成的60位值。RFC 4122 建议“在各种主机上生成 UUID 的分布式应用程序必须愿意依赖所有主机上的随机数源。如果这不可行，则应使用名称空间变体。”

应用场景

数据库键值：UUID 通常用作数据库表中的唯一键，MySQL、SQL Server、PostageSQL等DBMS都提供了不同的UUID函数；
分布式系统：在没有中央协调器的情况下，确保唯一标识符；
软件构建：在构建过程中生成唯一的组件或版本标识符；
文件系统：用于标识文件或目录的唯一性。

一些问题

大小问题：相对于简单的ID标识符，UUID虽然提供了极低的唯一性，但也因其128位的长度占用了相对较大的空间；
- 如数据库，使用UUID作为主键会导致索引体积增大；
可排序性问题：UUID的生成方式（尤其是版本4随机生成）导致它们在时间上是无序的；
- 数据库索引：无序的UUID会导致数据库索引碎片化，进而降低查询性能；
- 日志记录：无序的UUID可能导致难以按时间顺序排序或筛选记录；
可预测性问题：某些版本的UUID（如版本1）可能会泄露生成时间和生成设备的信息，从而存在安全隐患。
重复问题：尽管UUID设计上是唯一的，但并不能完全排除重复的可能性；
- 生成算法设计不合理；
- 依赖MAC、ID等选取不合理；
- 随机数碰撞；

一些解决问题的方案

使用BINARY(16)而不是CHAR(36)来存储UUID；
使用有序UUID（如时间UUID）来确保在时间上的排序性，从而提高索引和查询性能；
对于需要短而可读标识符的场景，可以考虑使用短UUID；

UUID 应用实现

Python

import uuid

# 生成一个UUID（版本4）
unique_id = uuid.uuid4()
print(unique_id)

MySQL

方案1：调用UUID()函数：

INSERT INTO my_table (id, name)
VALUES (UUID(), 'Example Name');

方案2：触发器实现

-- 这个触发器会在每次插入数据之前检查`id`是否为空，如果是，则生成一个新的UUID。
DELIMITER //

CREATE TRIGGER before_insert_my_table
BEFORE INSERT ON my_table
FOR EACH ROW
BEGIN
    IF NEW.id IS NULL THEN
        SET NEW.id = UUID();
    END IF;
END;

//

DELIMITER ;

-- 调用
INSERT INTO my_table (name) VALUES ('Example Name');

参考阅读

数字化的未来在今日之务实

Mon, 22 Jul 2024 07:52:00 GMT

数字化是一个庞大的话题，晚生初出象牙塔，入行尚浅，无评论之能力，编写意在同诸君分享在工作学习中的一些感悟。对诸多事物见识短浅，理解有不妥之处，还望斧正，行文有诸多不准确之处，还望谅解。

我曾经简要地将我对改革开放后工业发展进程概括为这样几个节点：

在这样发展的进程中，我们一路探索、学习，各行各业都在学习世界行业先进企业的做法，或是拿来主义，或是有所改进，总之许多企业都在摸着石头过河，我们整个工业制造业的布局也在学习和探索中前行。制造行业在市场化的洪流中不断探索，行政、法律法规、人才培养体系等各领域也在不断自我改革，适应时代。一路走来，我们提自动化、数字化，讲互联网+，我们将新技术应用在各行各业，不论会议还是演讲，三句不离创新，五句不离科技，凡科技创新者是一路绿灯，凡学科交叉者更放手去探。我们一路高歌猛进，跑了好远，终于发现，前面剩下的人不多了，路上可以循迹的脚印更是稀少，回头一看，我们似乎落下了不少东西。

近年来，随便一个十八线小城都能看到什么数字大厦、云网中心、智慧制造……中国人对数字生产的创造力早已溢出工厂，漫天的洪流已经淹没大地，渗入各行各业。走进随便一个高校，都能看见智慧教室，都能看见一群学生上蹿下跳筹备“互联网+”、创新创业，还有各种不知名的或这或那的竞赛……各行各业都争相把数字化放到考核内容里，只要做了数字化就是业绩，就是政绩，说得不好听点，就是路边的狗找你要包子都能嚷嚷两声数字化。

但是，各位是否还记得，我们为什么要做数字化？

数字之根在提高生产力

数字化转型，要转成什么样，数字化化得又是什么？

我们并不是为了数字化而数字化，而是为了提高生产力而数字化。我们的根本目的是要让数字化能力解决传统行业中的低效环节，让手工数据数字化，消除生产过程中信息统计、交接等等环节的低效、失真等等问题，让数字信息不再是制约生产的因素，让决策者、工作者的精力集中到生产中去，进而提高生产力。这要解决的便是数字化转型要转成什么样的问题。

这时候就会有人提到了，用降本增效来衡量数字化的成果，这样总没错了吧。还是有错，数字化降本降的是什么本？被许多人误解了，有人粗暴的认为，数字化就是用数字化平台取缔统计数据的人工，这样的认知是狭隘的。这便是要解决数字化化谁的问题。

我们在形容原始制造业时常常会用这些词汇：粗放、低效，究其原因还是由于技术等因素限制，我们无法精准控制生产过程中的各个环节，对物料资源的利用不尽充分，由此造成了粗放低效的生产。

例如，古时候我们要刨一块木料用作桌子，刨完切削雕刻完毕，我们便得到了一张可用的桌子，结束了。机械化的时代，我们用数控机床精确地操刀，用同样的一块木料造出了两张一模一样的桌子，并且可长期稳定地生产。在数字化的时代，在智能化的时代，还是这些木料，还是这些机床，还是这些桌子，新的技术给我们带来了什么？是全流程的效率提升。从这一刻起，我们不仅仅关注手里的木料、机床和桌子，我们关注木料从哪匹山来，走几小时几分钟的路到达车间大门；我们关注刨完的木屑将送往哪里去，哪些将被用作工业品，哪些将被用作合成板材；我们关注全球各地的人们喜欢什么样的桌子，每年每月每天世界各地的经销商销售出去了多少什么样的桌子……这是数字化，一切都没变，一切都变了，变得是产业链、供应链，从今天起在我们眼前透明、简单，我无需再费时费力的等待季度、年度的报告，我可以实时关注市场数据，随时做出响应决策，这是优质的数字化，是高质量的生产。

在这个过程中，我们用数字化的能力，消去了生产当中一切不清楚、不明晰的环节，由此从供应链的层面整体地提升了效率。在这当中还有一个关于数字化转型的辩证理解：数字化要落到实处，落到细节，但数字化之原意还是要提升生产决策过程对整体的把握能力；同时，也不可因为讲整体就泛泛而谈，导致呈现到账面上来的都是些空泛的数字，对生产毫无帮助。由此，数字化工作，要么别做，要做就要粗细兼顾，把数字化的每一步都夯实了，如若在数字化的过程中省事，图表面形式，呵，这样的数字化简直是为生产行政徒增负担，不过是加重了基层工作者的压力。

这些言论来自我亲身的经历，但我讲得不好。关于这类话题，习近平总书记有一针见血的讲话：

同时，制约高质量发展因素还大量存在。从外部环境看，世界百年未有之大变局全方位、深层次加速演进。从内在条件看，我国一些领域关键核心技术受制于人的局面尚未根本改变，城乡区域发展和收入分配差距依然较大，掣肘经济社会高质量发展。从工作推进情况看，有的领导干部认识不到位，实际工作中一遇到矛盾和困难又习惯性回到追求粗放扩张、低效发展的老路上；有的领导干部观念陈旧，名曰推动高质量发展、实际上“新瓶装旧酒”；有的领导干部能力不足，面对国内外新环境新挑战，不知如何推动高质量发展，等等。对这些问题，要高度重视，切实解决。我们必须牢记高质量发展是新时代的硬道理，完整、准确、全面贯彻新发展理念，把加快建设现代化经济体系、推进高水平科技自立自强、加快构建新发展格局、统筹推进深层次改革和高水平开放、统筹高质量发展和高水平安全等战略任务落实到位，完善推动高质量发展的考核评价体系，为推动高质量发展打牢基础。
——习近平总书记2024年1月31日在二十届中央政治局第十一次集体学习时的讲话。（参考阅读）

实际见闻

我工作在某事业单位的数字化系统实施一线，作为一个计科出身的学生，我的工作并没有那么对口。但我的想法很明确，软件实施和客户化开发是软件工程实践的重要环节，并且，我希望将数字化制造作为我终生为之奋斗的事业，从后面的经历来讲，这份工作是符合我的想象的，对我来说有足够的收获，但并不都是正面的收获。

我明确地意识到实施客开就是数字化应用的第一线，实况也确实如此，可和我所想不同的是，数字化的第一线竟是”最不数字“的。在一线，我们将大量的手工报表录入系统，我尽可能使用Python和一些自动化工具去解决问题，因为实在有太多工作是手工的了，我无法想象，在此之前，他们竟然是完全手工在处理这些数据，这和我对数字化的认知大相径庭。就算说曾经的企业没有数字化的底子，可是作为一家相当前沿的ERP企业竟然没有自动化的，针对场景的实施方案也不可理解。我们使用的业务系统，在许多地方也和业务内容严重脱节，这也是导致我们在许多场景下不得不手工操作的原因之一，由这一点，我认为那些个闭门造车产品经理和开发团队都该来一线干几个月，再回去造他们的车去。

我还在工作中见到了许多不合规范的东西，当然这些不是硬性规定，而是专业软件工程工作流程应有的规范！涉及网络工程、网络安全、数据安全，细节不便讲，可这对一个入行不久的晚生来说实在难以接受，这些东西让我对软件工程的实践大失所望，难道世界真的是一个草台班子？绝不能如此。

我不是成大事者，也没有什么宏大的愿望，可我对数字化的未来充满期待，对生产力带来的新时代充满期待。我希望我的一生，为技术、为数字化尽力，专业、严谨且务实，绝不应草草了事。我的见闻让我难过。

参考阅读

SQLite简介与安装环境配置分享（附多方案连接测试）

Fri, 19 Jul 2024 07:51:00 GMT

SQLite 是一个内置库，实现了一个自包含、无服务器、零配置的事务性 SQL 数据库引擎。SQLite 的代码属于公共领域，因此可以自由用于任何目的，无论是商业用途还是私人用途。

SQLite基础知识

正如官方文档所说，SQLite的对手是fopen()，SQLite不能与MySQL、Oracle之类的数据库相比，因为它的构造和要解决的任务与这些数据库完全不一样。

SQLite的轻量特性让它在处理嵌入式、本地应用和一些低配场景服务时得心应手。此外，SQLite无需依赖多余文件，产生的数据库文件也只有一个.db或一个.zip压缩包，这让数据共享和同步变得非常简单。将SQLite引擎内置到程序中也毫无压力，由此在大家没有感知的过程中，SQLite已经成为了世界上应用最广泛的数据库，存在于嵌入式设备、移动应用等等场景中。

数据类型

基本数据类型（存储类）

大多数 SQL 数据库引擎（据我们所知，除了 SQLite 之外的每个 SQL 数据库引擎）都使用静态的、严格的类型。使用静态类型时，值的数据类型由其容器（存储值的特定列）决定。SQLite 使用更通用的动态类型系统。
—— sqlite.readdevdocs.com

在SQLite中具有如下数据类型（在这里也叫存储类）：

数据类型	描述
NULL	表示一个空值。
INTEGER	带符号的整型，根据值的大小自动选择1、2、3、4、6或8字节进行存储。
REAL	浮点数，存储为8字节的IEEE浮点数。
TEXT	文本字符串，使用数据库编码（UTF-8、UTF-16BE或UTF-16LE）存储。
BLOB	二进制大对象，是一个任意长度的数据块，以输入的格式存储（即不进行编码转换）。

布尔值与日期时间

SQLite没有为布尔值和日期时间预留单独的数据类型，而采用了更通用的方式对这些值进行表示。

布尔值
- 从版本 3.23.0 (2018-04-02) 开始，SQLite 识别关键字“TRUE”和“FALSE”，但这些关键字实际上只是整数文字 1 和 0 的替代拼写。
日期和时间（应用程序可以选择以这些格式中的任何一种存储日期和时间，并使用内置的日期和时间函数在格式之间自由转换。）
- TEXT作为 ISO8601 字符串（“YYYY-MM-DD HH:MM:SS.SSS”）。
- REAL作为 Julian 天数，根据 proleptic Gregorian calendar，从公元前 4714 年 11 月 24 日格林威治中午开始的天数。
- INTEGER作为 Unix 时间，自 1970-01-01 00:00:00 UTC 以来的秒数。

数据亲和性

我这样理解SQLite中的类型亲和性（Type Affinity）概念，即在建表时所规定的列数据类型只是对数据库引擎的建议，对其存储何类数据不构成强制限制，数据库引擎会根据实际数据选取合适的数据类型。

将SQLite中的五种类型亲和归纳如下：

类型亲和性	描述
TEXT	列中的值倾向于被存储为文本字符串。
NUMERIC	列中的值倾向于被存储为数值。如果不能转换为数值，则作为TEXT存储。
INTEGER	类似于NUMERIC，但会优先存储为整数。
REAL	列中的值倾向于被存储为浮点数。
BLOB	值将以其输入的形式存储，不进行任何转换。

因为我也是刚刚学习使用SQLite，实话实说文档上关于亲和类型的描述给我绕得够呛，这玩意只能到实践中去理解了，此外我认为其他编程语言中的数据类型兼容机制也有助于理解SQLite的亲和性设计。

SQLite环境配置

环境介绍

操作系统：Windows 11 23H2
目标环境：SQLite 3.46.0.

操作步骤

前往SQLite官网下载sqlite-dll-win-x64-3460000.zip和sqlite-tools-win-x64-3460000.zip；
创建一个sqlite目录并将两个压缩包解压至该目录下；
将上述目录添加到PATH系统环境变量，并确定；
新开终端，输入sqlite3，输出如下结果，完毕。

Connected to a transient in-memory database:这一输出表示我们在使用sqlite3时没有指定数据库文件，SQLite为我们自动创建了一个临时的数据库。

这个安装过程就体现出了SQLite的绝佳优势：无需配置，作为一个无需配置的轻量级数据库，在Linux下的安装也同样简洁。

SQLite 命令和语句

启动SQLite：sqlite3 <database_name.db>

基础命令

.help -- 获取帮助
.exit -- 退出SQLite

.open database_name.db -- 打开或创建数据库
.close -- 关闭当前数据库

.tables -- 显示所有表
.schema table_name -- 查看表结构

.headers on/off -- 开/关列名显示
.dbinfo -- 查看当前数据库大小

SQL语句

SQLite的基本查询操作和一般SQL一致，也有一些独特之处和扩展功能。

自增主键

CREATE TABLE table_name (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    column1 TEXT
);

UPSET语法，用于冲突时更新记录

INSERT INTO users (id, name) VALUES (1, 'Alice')
ON CONFLICT(id) DO UPDATE SET name = excluded.name;

WITHOUT ROWID创建不带隐藏ID的表
默认情况下，SQLite中的每个表都有一个隐含的ROWID列，它是一个唯一的整数，用于标识表中的每一行。WITHOUT ROWID允许你创建一个没有ROWID列的表，依赖于用户定义的主键来唯一标识每一行以节省内存空间。

CREATE TABLE example (
    id INTEGER PRIMARY KEY,
    name TEXT,
    age INTEGER
) WITHOUT ROWID;

Navicat SQLite连接测试

Navicat连接也是非常的简单顺利，选择数据库路径即可。

C++ SQLite连接测试

测试环境

Windows11 23H2 64位
Visual Studio 2022

编译获取库文件

这篇文章中提到了更丰富的自定义编译方法，有需求请参阅原文：windows平台sqlite3的编译及简单使用 | Ivanzz (ivanzz1001.github.io)

在官网下载sqlite-amalgamation-3460000.zip，这是SQLite的源码文件，当中包含sqlite.h头文件；
基于预编译好的动态链接库来编译得到sqlite.lib；
1. 将sqlite-dll-win-x64-3460000.zip解压缩到一个目录下；
2. 管理员身份启动"Developer Command Prompt for VS 2022"（可以直接在开始菜单中搜索）；
3. 切换到刚刚解压的目录下并执行下述命令：

我的目录在D盘下，故需要先切换盘符，再切换到对应的解压目录
> D:
> cd D:\Real_Path\sqlite-dll-win-x64-3460000
> lib /def:sqlite3.def /machine:x64

执行完毕后，目录中会出现sqlite.lib和sqlite.exp文件，命令行界面示意如下：

在VS项目中添加对应文件路径

创建一个新的C++ CLI项目；
右键项目名称后选择 Properties，即项目属性；
在 Configuration Properties -> C/C++ -> General 中，找到 Additional Include Directories，添加sqlite3.h头文件所在目录；
在 Configuration Properties -> Linker -> General 中，找到 Additional Library Directories，添加sqlite3.lib所在目录。
在Configuration Properties -> Linker -> Input 中，找到找到 Additional Library Directories，添加sqlite3.lib。

编码测试

给出demo如下，生成编译代码并运行：

#include <iostream>
#include "sqlite3.h"

// 回调函数，用于处理查询结果
static int callback(void* NotUsed, int argc, char** argv, char** azColName) {
    for (int i = 0; i < argc; i++) {
        std::cout << azColName[i] << ": " << (argv[i] ? argv[i] : "NULL") << std::endl;
    }
    std::cout << std::endl;
    return 0;
}

int main() {
    sqlite3* db;
    char* zErrMsg = nullptr;
    int rc;

    // 打开数据库连接，如果不存在则创建一个
    rc = sqlite3_open("test.db", &db);
    if (rc) {
        std::cerr << "Can't open database: " << sqlite3_errmsg(db) << std::endl;
        return rc;
    }
    else {
        std::cout << "Opened database successfully" << std::endl;
    }

    // 创建表
    const char* sqlCreateTable = "CREATE TABLE IF NOT EXISTS COMPANY("
        "ID INT PRIMARY KEY NOT NULL,"
        "NAME TEXT NOT NULL,"
        "AGE INT NOT NULL,"
        "ADDRESS CHAR(50),"
        "SALARY REAL);";

    rc = sqlite3_exec(db, sqlCreateTable, callback, 0, &zErrMsg);
    if (rc != SQLITE_OK) {
        std::cerr << "SQL error: " << zErrMsg << std::endl;
        sqlite3_free(zErrMsg);
    }
    else {
        std::cout << "Table created successfully" << std::endl;
    }

    // 插入数据
    const char* sqlInsertData = "INSERT INTO COMPANY (ID, NAME, AGE, ADDRESS, SALARY) "
        "VALUES (1, 'Paul', 32, 'California', 20000.00); "
        "INSERT INTO COMPANY (ID, NAME, AGE, ADDRESS, SALARY) "
        "VALUES (2, 'Allen', 25, 'Texas', 15000.00); "
        "INSERT INTO COMPANY (ID, NAME, AGE, ADDRESS, SALARY) "
        "VALUES (3, 'Teddy', 23, 'Norway', 20000.00); "
        "INSERT INTO COMPANY (ID, NAME, AGE, ADDRESS, SALARY) "
        "VALUES (4, 'Mark', 25, 'Rich-Mond', 65000.00);";

    rc = sqlite3_exec(db, sqlInsertData, callback, 0, &zErrMsg);
    if (rc != SQLITE_OK) {
        std::cerr << "SQL error: " << zErrMsg << std::endl;
        sqlite3_free(zErrMsg);
    }
    else {
        std::cout << "Records inserted successfully" << std::endl;
    }

    // 查询数据
    const char* sqlSelectData = "SELECT * FROM COMPANY;";
    rc = sqlite3_exec(db, sqlSelectData, callback, 0, &zErrMsg);
    if (rc != SQLITE_OK) {
        std::cerr << "SQL error: " << zErrMsg << std::endl;
        sqlite3_free(zErrMsg);
    }
    else {
        std::cout << "Operation done successfully" << std::endl;
    }

    // 关闭数据库连接
    sqlite3_close(db);
    return 0;
}

成功运行并输出如下结果：

Python SQLite连接测试

sqlite3库内置于Python标准库中。
The module was written by Gerhard Häring. It provides an SQL interface compliant with the DB-API 2.0 specification described by PEP 249, and requires SQLite 3.7.15 or newer.

相对来说，在Python下连接SQLite就要简单的多了。

测试环境

Python 3.11.0
Pycharm 2023.1.4

如果您是首次在Pycharm中连接SQLite数据库，那么跟随Pycharm提示简单配置并安装相关驱动即可。

import sqlite3  
  
# 连接到SQLite数据库（如果数据库文件不存在，会自动创建一个）  
conn = sqlite3.connect('example.db')  
  
# 创建一个游标对象，用于执行SQL语句  
cursor = conn.cursor()  
  
# 创建表  
cursor.execute('''  
CREATE TABLE IF NOT EXISTS users (  
id INTEGER PRIMARY KEY,  
name TEXT NOT NULL,  
age INTEGER NOT NULL  
)  
''')  
  
# 插入数据  
cursor.execute('''  
INSERT INTO users (name, age)  
VALUES ('Alice', 30)  
''')  
  
cursor.execute('''  
INSERT INTO users (name, age)  
VALUES ('Bob', 25)  
''')  
  
# 提交事务  
conn.commit()  
  
# 查询数据  
cursor.execute('SELECT * FROM users')  
rows = cursor.fetchall()  
  
# 打印查询结果  
for row in rows:  
print(row)  
  
# 关闭游标和连接  
cursor.close()  
conn.close()

正常连接并输出结果。

参考阅读

JSON基础知识梳理和Python JSON实践分享

Thu, 18 Jul 2024 07:15:00 GMT

JSON（JavaScript Object Notation）是一种轻量级的标准化数据交换格式，易于人类阅读和编写，同时也易于机器解析和生成。它基于JavaScript编程语言的一个子集，但独立于语言，这使得它广泛应用于各种编程环境中。JSON由 RFC 7159和 ECMA-404 指定，是一个受JavaScript的对象字面值句法启发的轻量级数据交换格式。

JSON

JSON通过键值对的形式来组织数据，JSON数据类型包含数字、字符串、数组等，通过简洁的符号对其进行区分。

JSON基本规则

基本数据结构类型

对象（Object）：一个无序的键值对集合，用 {} 括起来。
数组（Array）：一个有序的值集合，用 [] 括起来。
值（Value）：可以是字符串、数值、布尔值、对象、数组或 null。
基本语法规则
数据在名称/值对中
数据由逗号,分隔
使用反斜杠\来转义字符
字符串使用双引号""保存
一个简单的JSON数据段示例

{
  "name": "John",
  "age": 30,
  "isStudent": false,
  "courses": ["Math", "Science"],
  "address": {
    "city": "New York",
    "zip": "10001"
  }
}

Python JSON

Python和JSON数据结构对照

JSON 数据类型	描述	Python 数据结构
`Object`	无序的键值对集合	`dict`（字典）
`Array`	有序的值集合	`list`（列表）
`String`	字符串	`str`（字符串）
`Number`	数字（整数或浮点数）	`int` 或 `float`
`Boolean`	布尔值 `true` 或 `false`	`True` 或 `False`
`Null`	空值	`None`

Python JSON 序列化与反序列化

Python 内置了 json 模块来处理 JSON 数据，这个模块提供一些方法来实现JSON在Python中的解析与生成，概述如下：

json.loads()：从JSON字符串解析为Python对象；
json.load()：从文件中读取 JSON 数据；
json.dumps()：将 Python 对象生成 JSON 字符串；
json.dump()：将 Python 对象写入文件。
示例如下：

import json

json_data = '{"name": "John", "age": 30, "isStudent": false}'
python_obj = json.loads(json_data)
print(python_obj)
# 输出: {'name': 'John', 'age': 30, 'isStudent': False}

with open('data.json', 'r') as file:
    python_obj = json.load(file)
print(python_obj)

python_obj = {"name": "John", "age": 30, "isStudent": False}
json_data = json.dumps(python_obj) 
print(json_data) 
# 输出: {"name": "John", "age": 30, "isStudent": false}

with open('data.json', 'w') as file:
    json.dump(python_obj, file)

结合字典的JSON处理实践简要分享

我在编写一个密码库应用时，选择了JSON作为数据交换格式，在这里将其关键过程简要归纳后分享。

文件读取

import json

# 示例密码库数据
password_vault = {
    "example.com": {
        "username": "user1",
        "password": "pass123"
    },
    "another.com": {
        "username": "user2",
        "password": "pass456"
    }
}

# 将密码库保存到文件
with open('password_vault.json', 'w') as file:
    json.dump(password_vault, file, indent=4)

# 从文件读取密码库
with open('password_vault.json', 'r') as file:
    password_vault = json.load(file)

CRUD逻辑

# 增
def add_pwd(vault, site, username, password):
    if site in vault:
        print(f"Site {site} already exists. Use update_password to change the password.")
    else:
        vault[site] = {"username": username, "password": password}
        print(f"Added password for {site}")
        
# 改
def update_pwd(vault, site, new_password):
    if site in vault:
        vault[site]['password'] = new_password
        print(f"Updated password for {site}")
    else:
        print(f"Site {site} not found. Use add_password to add it first.")

# 删
def delete_pwd(vault, site):
    if site in vault:
        del vault[site]
        print(f"Deleted password for {site}")
    else:
        print(f"Site {site} not found.")

# 查
def get_pwd(vault, site):
    if site in vault:
        return vault[site]
    else:
        print(f"Site {site} not found.")
        return None


add_pwd(password_vault, "newsite.com", "user3", "pass789")
update_pwd(password_vault, "example.com", "newpass123")
delete_pwd(password_vault, "another.com")
password_info = get_pwd(password_vault, "example.com")

if password_info:
    print(f"Username: {password_info['username']}, Password: {password_info['password']}")

参考阅读

【回头看】SQL常用语句和特性整理

Wed, 17 Jul 2024 08:34:00 GMT

回头看系列文章序
自大三起我认识到，随着应用知识的扩展，基础知识的重要性愈加明显。时至今日，已经到了无法忽视的地步，以至于我们必须采取有效措施，认真巩固语言基础、数据库、操作系统等一系列重要基础知识，将零散的知识点体系化，我将这一计划称之为“回头看”。

SQL（Structured Query Language，结构化查询语言），用于关系数据库管理，也是一位熟悉又陌生的老朋友。SQL除了支持对数据库结构的创建、修改以及CRUD操作以外还支持多表联查、简单的逻辑操作等。

此外，SQL作为一个标准，在各类DBMS具体实现时并不一定完全遵守，它们虽然在基础的CRUD操作上没有什么分别，但具体特性却各有设计，被称之为SQL方言。

由此诸多特性，SQL其实不是一个学一遍记住就能完事的知识点，同Linux等诸多实践知识一样，SQL需要结合具体使用场景、具体数据结构具体分析，随用随学，必要时还要结合非关系型数据库管理方式对数据进行整合处理。本篇整合是对常用SQL语句的简单梳理，以备随时查询。

SQL对大小写不敏感；
每条SQL语句末都应接分号以表结束；
关系型数据库的层级概念：数据库 - 表 - 记录（行），视图。

数据库结构管理

SQL 对数据库结构的管理包括数据库对象的创建、修改和删除。这些对象包括数据库、表、视图、索引、约束和存储过程等。

数据库操作

-- 创建数据库
CREATE DATABASE database_name;
-- 删除数据库
DROP DATABASE database_name;
-- 切换到数据库
USE DATABASE;

表管理

-- 创建表
CREATE TABLE table_name (
	column1 datatype constraints, 
	column2 datatype constraints, 
	demo_id INT PRIMARY KEY AUTO_INCREMENT, 
	demo_name VARCHAR(100) NOT NULL,
	...
)

-- 修改表
-- 添加新列
ALTER TABLE table_name ADD column_name datatype;
-- 删除列
ALTER TABLE table_name DROP COLUMN column_name;
-- 修改列的数据类型
ALTER TABLE table_name MODIFY COLUMN column_name new_datatype;

-- 删除表
DROP TABLE table_name;

视图

注意，更新视图无法直接使用UPDATE，应该更新原表数据后重新查询视图。

-- 创建视图
CREATE VIEW view_name AS
SELECT column1, column2, ...
FROM table_name
WHERE condition;

-- 修改视图
CREATE OR REPLACE VIEW view_name AS
SELECT column1, column2, ...
FROM table_name
WHERE condition;

-- 删除视图
DROP VIEW view_name;

索引

-- 编制索引
CREATE INDEX index_name
ON table_name (column_name);

-- 删除索引
DROP INDEX index_name ON table_name;

约束

常用约束类型

PRIMARY KEY：主键，唯一标识表中的每一行。
FOREIGN KEY：外键，确保引用完整性。
UNIQUE：唯一约束，确保列中的所有值唯一。
NOT NULL：非空约束，确保列中的值不能为空。
CHECK：检查约束，确保列中的值满足指定条件。

-- 添加约束
ALTER TABLE table_name
ADD CONSTRAINT constraint_name PRIMARY KEY (column_name);

-- 删除约束
ALTER TABLE table_name
DROP CONSTRAINT constraint_name;

触发器

-- 创建触发器
CREATE TRIGGER trigger_name
BEFORE | AFTER INSERT | UPDATE | DELETE
ON table_name
FOR EACH ROW
BEGIN
    -- SQL statements
END;

--删除触发器
DROP TRIGGER trigger_name;

存储过程与函数

-- 创建存储过程
CREATE PROCEDURE procedure_name (parameters)
BEGIN
    -- SQL statements
END;

-- 创建函数
CREATE FUNCTION function_name (parameters) RETURNS return_datatype
BEGIN
    -- SQL statements
    RETURN return_value;
END;

-- 删除存储过程/函数
DROP PROCEDURE procedure_name;
DROP FUNCTION function_name;

基本CRUD操作

增（Create）删（Delete）改（Update）查（Read），是每个程序员都逃不过去的坎。此外，SQL也可以和Excel配合使用完成一些数据操作。

查询 SELECT

-- 查询全部
SELECT * FROM table_name
-- 指定查询
SELECT column1, column2 FROM table_name;
-- 条件查询
SELECT * FROM table_name WHERE condition;
-- 查询结果排序
SELECT * FROM table_name
ORDER BY column1 [ASC|DESC];
--限制输出前n条数据
SELECT * FROM table_name
LIMIT n;

插入 INSERT

-- 向表格中插入值
INSERT INTO table_name VALUES (value1, value2, ....)

-- 向指定列插入值
INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

修改 UPDATE

UPDATE table_name
SET column1 = value1, column2 = value2, ...
WHERE condition;

删除 DELETE

DELETE FROM table_name WHERE condition;

连接 JOIN

SQL中的JOIN可以根据两表的共有字段将两个表的数据匹配输出，常见JOIN类型包括内连接、左连接、右连接、全连接、交叉连接和自连接。
示例表：employees和departments

employee_id	name	department_id
1	Alice	1
2	Bob	2
3	Charlie	2
4	Daniel	4

department_id	department_name
1	HR
2	IT
3	Finance

内连接（INNER JOIN）与全连接（FULL JOIN）

内连接：返回两个表中满足连接条件的所有行。如果在两个表中找不到匹配项，结果集中将不会包含该行。
全连接：返回两个表中的所有行。如果在一个表中没有匹配项，结果集中将包含NULL值。注：MySQL不支持全连接。

-- 内连接
SELECT employees.name, departments.department_name
FROM employees
INNER JOIN departments ON employees.department_id = departments.department_id;

-- 全连接
SELECT employees.name, departments.department_name
FROM employees
FULL OUTER JOIN departments ON employees.department_id = departments.department_id;

内连接返回结果

name	department_name
Alice	HR
Bob	IT
Charlie	IT

全连接返回结果

name	department_name
Alice	HR
Bob	IT
Charlie	IT
Daniel	NULL
NULL	Finance

左连接（LEFT JOIN）与右连接（RIGHT JOIN）

左连接：返回左表中的所有行，即使右表中没有匹配项。如果右表中没有匹配项，则结果集中对应的列将包含NULL值。
右连接：返回右表中的所有行，即使左表中没有匹配项。如果左表中没有匹配项，则结果集中对应的列将包含NULL值。

-- 左连接
SELECT employees.name, departments.department_name
FROM employees
LEFT JOIN departments ON employees.department_id = departments.department_id;

-- 右连接
SELECT employees.name, departments.department_name
FROM employees
RIGHT JOIN departments ON employees.department_id = departments.department_id;

左连接返回结果

name	department_name
Alice	HR
Bob	IT
Charlie	IT
Daniel	NULL

右连接返回结果

name	department_name
Alice	HR
Bob	IT
Charlie	IT
NULL	Finance

交叉连接（CROSS JOIN）

交叉连接返回两个表的笛卡尔积，即每个表中的每一行都与另一个表中的每一行组合。注意：在使用Cross Join时，不用使用on关键字。

SELECT employees.name, departments.department_name
FROM employees
CROSS JOIN departments;

交叉连接返回结果

name	department_name
Alice	HR
Alice	IT
Alice	Finance
Bob	HR
Bob	IT
Bob	Finance
Charlie	HR
Charlie	IT
Charlie	Finance
Daniel	HR
Daniel	IT
Daniel	Finance

自连接（SELF JOIN）

自连接是对自身表的连接，用于在同一个表中查找关系。
示例employees表：

employee_id	name	manager_id
1	Alice	NULL
2	Bob	1
3	Charlie	1

SELECT e1.name AS employee, e2.name AS manager FROM employees e1 LEFT JOIN employees e2 ON e1.manager_id = e2.employee_id;

自连接输出结果

employee	manager
Alice	NULL
Bob	Alice
Charlie	Alice

常用操作符

SQL 操作符

和许多编程语言一样，SQL提供了丰富的操作符，其类别包括：

算术操作符；
比较操作符；
逻辑操作符；
集合操作符；
位操作符；
字符串操作符；
特殊操作符。
其中，算数、比较、逻辑和位运算在各类语言中都大差不差，我在这里着选常用的集合操作符UNION和字符串操作符LIKE进行记录。

联合 UNION

UNION操作符用于合并两个或多个SELECT语句的结果集。

所有参与UNION的SELECT语句必须返回相同数量的列；
每个SELECT语句中的对应列必须具有相同或兼容的数据类型；
UNION默认去除重复行。如果希望包含所有结果（包括重复行），可以使用UNION ALL;
可以将UNION用于合并来自不同表、视图甚至不同数据库的数据源.

SELECT column1, column2, ...
FROM table1
UNION
SELECT column1, column2, ...
FROM table2;

匹配 LIKE

LIKE 操作符用于在 WHERE 子句中搜索列中的匹配模式。LIKE常与_和%组合使用，

SELECT column_name
FROM table_name
WHERE column_name LIKE pattern

% 通配符表示零个或多个字符；
_ 通配符表示单个字符。

-- 匹配以A开头的字符串
SELECT * FROM employees WHERE name LIKE 'A%';
-- 匹配以e结尾的字符串
SELECT * FROM employees WHERE name LIKE '%e';
-- 匹配包含特定字符串的字符串
SELECT * FROM employees WHERE name LIKE '%li%';
-- 匹配长度为3的字符串
SELECT * FROM employees WHERE name LIKE '___';
-- 匹配第二个字符是l的字符串
SELECT * FROM employees WHERE name LIKE '_l%';

参考阅读

Git常用命令整理

Mon, 15 Jul 2024 03:26:01 GMT

回头看系列文章序
自大三起，我认识到，随着应用知识的扩展，基础知识的重要性愈加明显。时至今日，已经到了无法忽视的地步，以至于我们必须采取有效措施，认真巩固语言基础、数据库、操作系统等一系列重要基础知识，将零散的知识点体系化，我将这一计划称之为“回头看”。

git配置

git --version 

# --global修改全局配置 /etc/gitconfig
git config --global user.name "yourname"
git config --global user.email test@mail.com

创建与提交

# 初始化本地git仓库
git init
# 提交到暂存区
git add
# 提交暂存区至本地仓库
git commit
git commit -m [message] # 添加备注信息
git commit -a # 不用add了
git commit --amend # 修复最后一次本地提交，可以避免漏掉少数文件、备注错填等问题，注意不要对已经push的commit使用amend
# 删除文件
git rm
# 比较暂存区和本地仓库
git diff
# 查看日志
git log
# 查看git状态
git status

远程操作

# 管理远程仓库
git remote
git remote add origin [url] # 配置远程仓库链接
git remote set-url origin [url] # 修改远程仓库源
git remote rename origin [new-name] # 重命名远程仓库名称
# 拷贝远程仓库
git clone
# 从远程获取代码库
git fetch
# 拉取远程仓库并合并
git pull
# 推送本地仓库并合并
git push

分支控制

# 创建分支
git branch # 列出本地分支
git branch [branchname]
git branch -d [branchname]
# 切换分支
git checkout [branchname]
git checkout -b [branchname] # 创建并切换到新分支
# 合并分支
git merge [branchname] # 将任意分支合并进当前分支
# 若出现冲突，则需手动处理，解决后使用git add告诉Git冲突解决

版本回滚

回退 reset

git log # 可查看版本号，也可在远程仓库上查看
# 注意回滚到制定版本号的版本后，其后版本均会消失
git reset --hard [version_code]
git push -f # 回退后，比远程更旧的版本需要强制推送

反做 revert

# 反做某一版本后，会生成基于该版本的新版本
git revert -n [version_code]

参考阅读

Python内置函数enumerate()

Fri, 12 Jul 2024 03:38:00 GMT

返回一个枚举对象。iterable 必须是一个序列，或 iterator，或其他支持迭代的对象。 enumerate() 返回的迭代器的 next() 方法返回一个元组，里面包含一个计数值（从 start 开始，默认为 0）和通过迭代 iterable 获得的值。

enumerate(iterable, start=0)

上面是官方文档的叙述，这玩意我是在做Excel数据处理时候遇到的，用法如下：

mouths = sheet.col_values(colx=0, start_rowx=1)

for row, mouth in enumerate(mouths):
    print(row, mouth)
  
# 测试输出
l1 = list(enumerate(mouths))
print(l1) # 如下
[(0, 1.0), (1, 2.0), (2, '3*'), (3, 4.0), (4, 5.0), (5, 6.0), (6, '7*'), (7, 8.0), (8, 9.0), (9, 10.0), (10, 11.0), (11, 12.0)]

简单来说，enumerate()可以将一个支持迭代的对象编制索引，并将它们一一映射，所得到的返回值就是一个元组，元组中包含其索引和原来的对象。这个内置函数一个相当大的作用便是在for循环当中使用，用于迭代计数等。是一个相当实用的内置函数。

参考阅读

博客维护及Markdown发布文章简要规范（更新中）

Wed, 12 Jun 2024 09:35:00 GMT

我在博客的维护实践中遇到了一些问题，用了各种手段解决，现在将这些解决方案以及相关的注意事项总结一下，形成一个简单的规范。编写不细，仅供参考，欢迎批评。

应用环境

博客环境
- halo
- 主题：halo-theme-hao
博客编辑器
- ByteMD
- Willow Markdown
本地编辑器
- typora
- obsidian / obsidian-lifeos

规范细则

这些规则都是为了解决特定问题制定的，我会根据实际应用场景遇到的问题不定期修订规范。

Markdown 攥写相关

在博客正文中应使用markdown二、三、四级标题；
```指定编程语言时涉C++应写为cpp，即```cpp；
若有序列表间隔诸多内容应手动编序，不要使用有序列表；
插入图片应编写其说明文本，不要偷懒；

封面设计

同一系列的封面应在版面设计、字体选取等方面保持一定的风格；
排版应尽可能遵循简洁、直观和居中的原则，且应留足版面页边距；

博客维护

标签、分类等url唯一标识生成后要注意及时修改为对应的英文；
url涉C++要写为cpp；
常用加载资源注意压缩；
上传图片注意去除图片EXIF信息。

规则阐释

对应阐述细则中的规则解决了什么问题。

Markdown 攥写相关

html会把一级标题解释为<h1>，这样会导致网页中出现多个h1标题，导致SEO混乱，不利于文章检索；若一篇文章中使用超过三级以上的标题会比较混乱，故规定使用二三四级标题来实现段落分节；
在网页解析中会把c++的加号识别为间隔符，看起来就变成c了；
如果有序列表中间间隔，哪怕你手动修改为连续序号，也会被解释器当成独立的有序列表，导致文章看起来全是1、1、1、1……；
这个也是为了SEO和检索考虑；

封面设计

美观、统一、顺眼；
重点是居中，在hao主题和好多有侧栏的主题中，侧栏封面是一个方框，若不居中设计会导致方框中元素被截断，微信公众号同理，当然不在意也可以；给元素留边距是为了适应不同的流式布局；

博客维护

自动生成的是拼音加下划线的形式，很显然这不是咱们想要的效果；
和markdown第2条一个道理；
这个不必多说，压缩压缩省钱、省时间，但很多时候我还是想放原图，我应该再思考思考解决这个矛盾；
保护隐私。

设计模式概述及五个常见的设计模式详解（C++用例）

Fri, 31 May 2024 13:00:00 GMT

概述

设计模式

1994年，Erich Gamma等四人（Gang of Four）出版了Design Patterns - Elements of Reusable Object-Oriented Software即《设计模式-可复用的面向对象软件元素》，该书中首次提到了软件开发中的设计模式理念。他们提出的设计模式主要基于这样的面向对象设计元素：

对接口编程而不是对实现编程
优先使用对象组合而不是继承
在这本书中，他们提出了23种设计模式，它们被广泛认为是解决面向对象设计种常见问题的经典方案，这些方案被分为三大类：创建型、结构型和行为型。

我对设计模式的理解

首先，设计模式是一种思想，这种思想不仅仅适用于程序设计。这样的思想来源于生活，被用于程序设计，这也意味着它一样适用于现实生活中的逻辑。也许我们在编程和生活中并不会刻意的提到某种模式，但这并不意味着我们不会用到某种设计模式的思想，学习设计模式可以让我们规避更多弯路，提高设计效率，让程序设计过程模板化、规范化。

此外，由于它是一种抽象思维的归纳和概括，我们绝不应按照书面的文字去理解设计模式，而应当结合实例，不论是生活上的还是程序上的。文字是死板的，但思想是灵活的，由此我们并不需要刻意而严肃地去背诵设计模式。在学习之处，我们可以略微刻板些去学习几个常见的设计模式概念，然后再到实际程序设计中去发现它们，进而不断提高自己的程序设计能力和思维水准。

最后，对于程序设计中的设计模式，它是面向对象的思想，应当首先建立在面向对象思维的基础上。基于某个编程语言，比如C++的实例去理解设计模式时，应当首先理解C++的面向对象相关理念。

单例模式

单例模式（Singleton Pattern）的主要目标是确保某个类只有一个实例存在，并提供一个访问该实例的全局访问点。这意味着，无论何时何地，只要通过这个访问点获取到的都是同一个实例。单例模式在需要频繁访问共享资源或控制实例数量的场景中非常有用。

优缺点

优点

控制实例数量：确保一个类只有一个实例，节省资源；
全局访问点：提供全局访问点，方便管理和访问共享资源；
延迟加载：懒汉式单例可以延迟加载，只有在需要时才创建实例。

缺点

不利于扩展：单例模式使类变得难以扩展，因为它限制了继承和多态性；
隐藏依赖关系：全局访问点可能会隐藏类之间的依赖关系，导致代码难以理解和维护；
并发问题：多线程环境下需要处理线程安全问题，增加了实现复杂性。

应用场景

资源管理：如数据库连接池、线程池、日志管理器等；
配置管理：全局配置类，保证应用程序中的配置一致；
设备管理：如打印机管理类，确保只有一个实例与物理设备交互。

实现方法

这里列举四种常见的实现方式。

1.懒汉式单例（Lazy Initialization）

懒汉式单例在第一次使用时进行实例化，确保只有在需要时才创建对象。

class Singleton {
private:
    static Singleton* instance;
    Singleton() {}  // 私有构造函数

public:
    static Singleton* getInstance() {
        if (instance == nullptr) {
            instance = new Singleton();
        }
        return instance;
    }

    // 禁止拷贝和赋值操作
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
};

// 初始化静态成员
Singleton* Singleton::instance = nullptr;

2.饿汉式单例（Eager Initialization）

饿汉式单例在类加载时就创建实例，保证线程安全，但如果该实例占用资源较多，可能会导致不必要的资源浪费。

class Singleton {
private:
    static Singleton* instance;
    Singleton() {}  // 私有构造函数

public:
    static Singleton* getInstance() {
        return instance;
    }

    // 禁止拷贝和赋值操作
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
};

// 初始化静态成员
Singleton* Singleton::instance = new Singleton();

3.线程安全的懒汉式单例

通过双重检查锁定（Double-Checked Locking）机制实现线程安全的懒汉式单例。

#include <mutex>

class Singleton {
private:
    static Singleton* instance;
    static std::mutex mtx;
    Singleton() {}  // 私有构造函数

public:
    static Singleton* getInstance() {
        if (instance == nullptr) {
            std::lock_guard<std::mutex> lock(mtx);
            if (instance == nullptr) {
                instance = new Singleton();
            }
        }
        return instance;
    }

    // 禁止拷贝和赋值操作
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
};

// 初始化静态成员
Singleton* Singleton::instance = nullptr;
std::mutex Singleton::mtx;

4. 使用C++11的线程安全局部静态变量

C++11标准保证了局部静态变量的线程安全性，简化了单例模式的实现。

class Singleton {
private:
    Singleton() {}  // 私有构造函数

public:
    static Singleton& getInstance() {
        static Singleton instance;
        return instance;
    }

    // 禁止拷贝和赋值操作
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
};

工厂方法模式

工厂方法模式（Factory Method Pattern）是创建型设计模式之一，也被称作简单工厂模式，它通过定义一个创建对象的接口来处理对象的实例化，具体的实现由子类来完成。这样做的好处是使得客户端代码依赖于抽象接口而不是具体的实现类，从而提高了系统的灵活性和可扩展性。

工厂方法模式通常涉及以下几个角色：

产品（Product）：定义了工厂方法所创建的对象的接口。
具体产品（ConcreteProduct）：实现了产品接口的具体类。
工厂（Creator）：声明了返回产品对象的工厂方法，通常是一个抽象类或接口。
具体工厂（ConcreteCreator）：实现了工厂方法以创建具体产品的实例。

优缺点

优点

遵循开闭原则：可以在不修改现有代码的情况下引入新的产品类型。
单一职责原则：将产品创建代码与产品使用代码分离。
提高代码的灵活性和可扩展性：可以方便地替换或增加产品。

缺点

增加代码复杂度：需要为每一个具体产品创建一个具体工厂类。
引入大量子类：当产品种类较多时，会增加系统的复杂度和维护难度。

应用场景

当一个类不知道它所需要的对象的具体类时。工厂方法模式将对象的创建延迟到子类，从而实现了解耦。
当一个类希望由其子类来指定创建对象时。通过定义工厂方法，基类可以把创建对象的责任转移给子类。
当类的实例化过程涉及较多逻辑时。将这些逻辑集中在一个工厂方法中，可以简化客户端代码。

实现方法

1.产品接口和具体产品

// 抽象产品
class Product {
public:
    virtual ~Product() {}
    virtual std::string operation() const = 0;
};

// 具体产品A
class ConcreteProductA : public Product {
public:
    std::string operation() const override {
        return "Result of the ConcreteProductA";
    }
};

// 具体产品B
class ConcreteProductB : public Product {
public:
    std::string operation() const override {
        return "Result of the ConcreteProductB";
    }
};

2. 工厂接口和具体工厂

// 抽象工厂
class Creator {
public:
    virtual ~Creator() {}
    virtual Product* factoryMethod() const = 0;

    std::string someOperation() const {
        Product* product = this->factoryMethod();
        std::string result = "Creator: The same creator's code has just worked with " + product->operation();
        delete product;
        return result;
    }
};

// 具体工厂A
class ConcreteCreatorA : public Creator {
public:
    Product* factoryMethod() const override {
        return new ConcreteProductA();
    }
};

// 具体工厂B
class ConcreteCreatorB : public Creator {
public:
    Product* factoryMethod() const override {
        return new ConcreteProductB();
    }
};

3. 客户端代码

// 接受一个工厂对象作为参数
void ClientCode(const Creator& creator) {
    std::cout << "Client: I'm not aware of the creator's class, but it still works.\n"
              << creator.someOperation() << std::endl;
}

int main() {
    std::cout << "App: Launched with the ConcreteCreatorA.\n";
    Creator* creator = new ConcreteCreatorA();
    ClientCode(*creator);
    delete creator;

    std::cout << "App: Launched with the ConcreteCreatorB.\n";
    creator = new ConcreteCreatorB();
    ClientCode(*creator);
    delete creator;

    return 0;
}

策略模式

策略模式（Strategy Pattern）是一种行为设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以相互替换。策略模式使得算法可以独立于使用它的客户端变化。它让算法的变化独立于使用算法的客户，使得代码更加灵活和可扩展。

策略模式涉及以下几个角色：

上下文（Context）：也叫环境，维护一个策略对象的引用。
策略接口（Strategy）：定义一个算法家族的接口。
具体策略（ConcreteStrategy）：实现了算法接口的具体策略类。

优缺点

优点

遵循开闭原则：可以在不修改上下文类的情况下引入新的策略；
避免多重条件语句：通过使用策略模式，可以消除代码中的条件分支语句；
提高代码的灵活性和可维护性：将算法和业务逻辑分离，使得代码更加清晰。

缺点

增加对象数量：每个具体策略都是一个独立的类，这会增加类的数量；
策略切换开销：频繁切换策略可能会带来一定的开销。

应用场景

多个类只有在算法或行为上稍有不同的场景：通过策略模式可以定义一系列可重用的算法或行为；
需要在不同的时间点应用不同的算法的场景：策略模式可以将每个算法封装到策略类中，在运行时动态选择算法；
消除条件分支语句的场景：将条件分支语句中的不同算法或行为提取到策略类中。

实现方法

1.策略和具体策略

// 策略接口
class Strategy {
public:
    virtual ~Strategy() {}
    virtual void StrategyMethod() const = 0;
};

// 具体策略A
class ConcreteStrategyA : public Strategy {
public:
    void StrategyMethod() const override {
        std::cout << "ConcreteStrategyA: 执行算法A" << std::endl;
    }
};

// 具体策略B
class ConcreteStrategyB : public Strategy {
public:
    void StrategyMethod() const override {
        std::cout << "ConcreteStrategyB: 执行算法B" << std::endl;
    }
};

2.上下文类

// 上下文类
class Context {
private:
    Strategy* strategy;
public:
    Context(Strategy* strategy = nullptr) : strategy(strategy) {}
    ~Context() { delete strategy; }

    void setStrategy(Strategy* strategy) {
        delete this->strategy;
        this->strategy = strategy;
    }

    void executeStrategy() const {
        if (this->strategy) {
            this->strategy->execute();
        } else {
            std::cout << "Context: 策略未设置" << std::endl;
        }
    }
};

3.客户端代码

int main() {
    Context* context = new Context(new ConcreteStrategyA());
    context->executeStrategy();

    context->setStrategy(new ConcreteStrategyB());
    context->executeStrategy();

    delete context;
    return 0;
}

观察者模式

观察者模式（Observer Pattern）是一种行为设计模式，定义了一种一对多的依赖关系，让多个观察者对象同时监听某一个主题对象。当主题对象的状态发生变化时，会通知所有观察者对象，使它们能够自动更新自己。观察者模式广泛应用于事件处理系统中，如GUI事件监听、数据模型与视图同步等。

由观察者模式的特性还可产生一些变体，例如推模型将主题更新主动推送给观察者，拉模型是指观察者主动从主题拉取更新信息，还有事件驱动模型，结合事件机制实现更加灵活的通知机制。

观察者模式包含角色如下：

主题（Subject）：也称为被观察者，维护一个观察者列表，并在自身状态发生变化时通知所有观察者。
观察者（Observer）：定义一个更新接口，用于接收主题的通知。
具体主题（ConcreteSubject）：实现了主题接口，包含一些状态，当状态变化时，通知所有观察者。
具体观察者（ConcreteObserver）：实现了观察者接口，更新自身状态以与主题保持一致。

优缺点

优点

解耦：观察者模式将观察者和主题解耦，使得它们可以独立变化。
灵活性：增加或减少观察者都很方便，不需要修改主题代码。
符合开闭原则：可以在不修改现有代码的情况下增加新的观察者。

缺点

潜在的性能问题：如果观察者过多，通知的时间会变长，影响性能。
复杂性增加：观察者和主题之间的依赖关系可能会比较复杂，维护起来困难。
可能出现循环依赖：不当的设计可能导致观察者和主题之间的循环调用，造成系统崩溃。

应用场景

事件处理系统：如GUI应用程序中的事件监听。
数据模型与视图同步：如MVC框架中的视图与模型同步。
订阅-发布系统：如消息队列系统、实时数据推送系统。

实现方法

1.主题及具体主题

#include <iostream>
#include <vector>
#include <algorithm>

// 观察者接口
class Observer {
public:
    virtual ~Observer() {}
    virtual void update(const std::string& message_from_subject) = 0;
};

// 主题接口
class Subject {
public:
    virtual ~Subject() {}
    virtual void attach(Observer* observer) = 0;
    virtual void detach(Observer* observer) = 0;
    virtual void notify() = 0;
};

// 具体主题
class ConcreteSubject : public Subject {
private:
    std::vector<Observer*> observers;
    std::string message;
public:
    void attach(Observer* observer) override {
        observers.push_back(observer);
    }

    void detach(Observer* observer) override {
        observers.erase(std::remove(observers.begin(), observers.end(), observer), observers.end());
    }

    void notify() override {
        for (Observer* observer : observers) {
            observer->update(message);
        }
    }

    void createMessage(const std::string& message) {
        this->message = message;
        notify();
    }
};

2.观察者及具体观察者

// 具体观察者
class ConcreteObserver : public Observer {
private:
    std::string message_from_subject;
    ConcreteSubject& subject;
public:
    ConcreteObserver(ConcreteSubject& subject) : subject(subject) {
        this->subject.attach(this);
    }

    ~ConcreteObserver() {
        subject.detach(this);
    }

    void update(const std::string& message_from_subject) override {
        this->message_from_subject = message_from_subject;
        printInfo();
    }

    void printInfo() {
        std::cout << "ConcreteObserver: 收到通知，消息为：" << message_from_subject << std::endl;
    }
};

3.客户端代码

int main() {
    ConcreteSubject* subject = new ConcreteSubject();
    ConcreteObserver* observer1 = new ConcreteObserver(*subject);
    ConcreteObserver* observer2 = new ConcreteObserver(*subject);
    ConcreteObserver* observer3 = new ConcreteObserver(*subject);

    subject->createMessage("Hello World!");
    subject->createMessage("Observer Pattern Example");

    delete observer3;
    delete observer2;
    delete observer1;
    delete subject;

    return 0;
}

装饰器模式

装饰器模式（Decorator Pattern）是一种结构型设计模式，它允许你通过将对象放入包含行为的特殊封装对象中来为原对象绑定新的行为。装饰器模式提供了一种更灵活的方式来扩展对象的功能，符合开闭原则，并且有助于职责分离。

装饰器模式的结构如下

组件（Component）：定义一个对象接口，可以动态地为该对象添加职责。
具体组件（ConcreteComponent）：实现组件接口的具体对象，可以为其添加职责。
装饰器（Decorator）：实现组件接口，内部包含一个组件对象，并在其基础上增加职责。
具体装饰器（ConcreteDecorator）：实现装饰器类，并在其基础上增加额外的行为。

优缺点

优点

更灵活的扩展方式：装饰器模式提供了一种比继承更灵活的方式来扩展对象的功能，避免了继承导致的类爆炸问题。
符合开闭原则：可以在不修改现有代码的情况下，通过组合不同的装饰器来增加新功能。
职责分离：可以将不同的功能分离到不同的装饰器中，实现单一职责原则。

缺点

增加复杂性：装饰器模式会增加系统中类和对象的数量，可能导致代码的复杂性增加。
调试困难：由于功能是通过多个装饰器叠加实现的，可能会导致调试和排错变得更加困难。

应用场景

需要动态地添加或删除功能：装饰器模式适用于那些需要动态地添加或删除功能的系统，如图形界面组件的装饰。
替代继承：当无法使用继承来扩展类的功能时，可以使用装饰器模式。
职责划分：将不同的功能分离到不同的装饰器中，有助于职责划分和代码复用。

实现方法

1.组件及具体组件

#include <iostream>
#include <string>

// 组件接口
class Component {
public:
    virtual ~Component() {}
    virtual std::string operation() const = 0;
};

// 具体组件
class ConcreteComponent : public Component {
public:
    std::string operation() const override {
        return "ConcreteComponent";
    }
};

2.装饰器和具体装饰器

// 装饰器类
class Decorator : public Component {
protected:
    Component* component;
public:
    Decorator(Component* component) : component(component) {}
    std::string operation() const override {
        return component->operation();
    }
};

// 具体装饰器A
class ConcreteDecoratorA : public Decorator {
public:
    ConcreteDecoratorA(Component* component) : Decorator(component) {}
    std::string operation() const override {
        return "ConcreteDecoratorA(" + Decorator::operation() + ")";
    }
};

// 具体装饰器B
class ConcreteDecoratorB : public Decorator {
public:
    ConcreteDecoratorB(Component* component) : Decorator(component) {}
    std::string operation() const override {
        return "ConcreteDecoratorB(" + Decorator::operation() + ")";
    }
};

3.客户端代码

void ClientCode(const Component& component) {
    std::cout << "RESULT: " << component.operation() << std::endl;
}

int main() {
    Component* simple = new ConcreteComponent();
    std::cout << "Client: I've got a simple component:\n";
    ClientCode(*simple);
    std::cout << "\n";

    Component* decorator1 = new ConcreteDecoratorA(simple);
    Component* decorator2 = new ConcreteDecoratorB(decorator1);
    std::cout << "Client: Now I've got a decorated component:\n";
    ClientCode(*decorator2);

    delete simple;
    delete decorator1;
    delete decorator2;

    return 0;
}

参考阅读

科研趣事|马鸣溪发现的恐龙叫马门溪龙

Thu, 30 May 2024 08:17:00 GMT

分享一个很有意思的科研趣事：在马鸣溪渡口旁工地发现的恐龙化石被命名为马门溪龙（Mamenchisaurus constructus）

今天偶然间在网上看见马门溪龙这一物种，开始我以为只是和我熟知的马鸣溪同音，我就好奇地随手一搜，没想到还真是一个有趣的口音故事。

我查阅了一份文献[1]，上面是这样描述马门溪龙化石的发现过程：

马门溪龙属（Mamenchisaurus Young，1954）是杨钟健于1954年根据产于四川宜宾市郊马门溪的一具不完整的蜥脚类恐龙化石骨架建立的。

很显然，这篇文章里提到的马门溪应当是误传，它指的就是现处于四川省宜宾市叙州区柏溪街道二二四金沙江马鸣溪大桥附近的区域。在另一篇学位论文[2]中我找到了更接近我猜想的描述：

1954年，杨钟健先生根据四川省宜宾县马门溪渡口侏罗纪地层中发现的一批破碎的材料，创立了马门溪龙属（Mamenchisaurus Young, 1954），同时命名马门溪龙种（Mamenchisaurus constructus Young, 1954）。

百度百科引用了一篇1954年的文献[3]做出了如下描述，更加通俗直接，但我并未找到这篇文章的原文：

最初研究的化石位于四川宜宾金沙江的马鸣溪渡口旁的建设工地，但由于杨钟健先生的口音问题而将“马鸣溪”误作为“马门溪”；种名建设（constructus）则指第一具化石是在建筑工地出土。

作为本地人我觉得这事儿太有意思了，我们的口音念“马鸣溪”确实像“马门溪”，就连我小时候都一度以为那个桥叫“马门溪大桥”，再加上杨钟健先生还是陕西人，听错的概率我想就更大了，这直接导致了恐龙被改名了，哈哈哈哈。当然本地人更惊讶的是，家门口居然有恐龙。

附图：马门溪龙：中华第一龙 | 中国国家地理网 (dili360.com)

参考文献

[1]李奎,蔡开基.马门溪龙属(Mamenchisaurus)的分类位置及演化[J].成都理工学院学报,1997(02):106-107+110-111.

[2]欧阳辉. 杨氏马门溪龙（Mamenchisaurus youngi）的骨骼特征与马门溪龙类的系统关系分类[D].成都理工大学,2005.

[3]Young, C.C. (1954), On a new sauropod from Yiping, Szechuan, China. sinica, III(4), 481-514.

【回头看之C++】lambda表达式

Tue, 21 May 2024 13:33:00 GMT

回头看系列文章序
自大三起我认识到，随着应用知识的扩展，基础知识的重要性愈加明显。时至今日，已经到了无法忽视的地步，以至于我们必须采取有效措施，认真巩固语言基础、数据库、操作系统等一系列重要基础知识，将零散的知识点体系化，我将这一计划称之为“回头看”。

C++ 11引入了lambda表达式，用于定义匿名函数，相比一般函数，lambda表达式定义方式更简洁，且允许在函数内部定义。Lambda 通常用于封装传递给算法或异步函数的少量代码行。本文描述内容基于C++11标准，后续变更请参考C++官方文档。

此外，我们还经常在Qt编程中接触lambda表达式，lambda的存在大大简化了定义槽函数的过程，lambda表达式还允许你在需要回调的地方内联定义回调逻辑、捕获局部变量，这些能力让Qt大大简化，变得简洁易读。

定义lambda表达式

官方文档中的语法描述（后续版本语法参考文末链接）：

示例：

auto plus = [] (int v1, int v2) -> int { return v1 + v2; }
int sum = plus(1, 2);

lambda 表达式的语法组成：

captures捕获列表：它指定捕获哪些变量，以及捕获是通过值还是通过引用进行的；
params参数列表（可选）：类似于函数的参数列表；
mutable 规范（可选）；
exception-specification异常选项（可选）；
trailing-return-type返回值类型（可选）：一般可以省略掉，由编译器来推导；
Lambda body：可以包含普通函数或成员函数体中允许的任何内容。

捕获列表

捕获列表是lambda表达式最大的特性之一，它指定捕获哪些变量，以及捕获是通过值还是通过引用进行的。

常用捕获列表形式示例如下：

[] 不捕获任何变量；
[&] 捕获外部作用域中的所有变量，通过引用捕获；
[=] 捕获外部作用域中的所有变量，通过值捕获，只读；
[bar] 通过值捕获bar变量，不捕获其他变量
[this] 捕获当前类中this指针，让lambda表达式拥有和当前类成员函数同样的访问权限
[=, &a] 通过值捕获外部作用域中的所有变量，并且指定通过引用捕获外部变量a；
[&, a] 通过引用捕获外部作用域中的所有变量，并且指定通过值捕获外部变量a.

注意
捕获列表中变量的生命周期必须大于lambda的生命周期，否则会导致未定义行为。按值捕获不会修改外部变量，按引用捕获可以修改外部变量。

mutable 规范

通常情况下，lambda表达式捕获的变量是只读的，这意味着我们不能在lambda表达式内部修改这些变量。但某些时候，我们希望在lambda内部修改捕获的变量，此时mutable就可以解决这个问题。

例如这样一个情景：

在这个例子中，x是按值捕获的，意味着lambda表达式内部有一个x的副本。由于默认情况下lambda表达式是不可变的，尝试修改捕获的变量会导致编译错误。

int x = 10;
auto lambda = [x]() {
    x++; // 错误：不能修改按值捕获的变量
};
lambda();

如果我们使用mutable选项，这时便可以对捕获的x副本进行自增处理，并且不影响原值：

int x = 10;
auto lambda = [x]() mutable {
    x++; // 正确：可以修改按值捕获的变量副本
    std::cout << x << std::endl; // 输出11
};
lambda();
std::cout << x << std::endl; // 输出10

也许是没有用到的原因，我总觉得这玩应略微有点鸡肋。

异常选项

异常选项是指通过noexcept说明符声明一个lambda表达式是否会抛出异常。这与普通函数的异常说明符（C++异常规范）类似。

作为一个可选选项，省略noexcept的默认情况下，编译器不会进行任何关于异常安全性的假设，允许排除异常，但缺点是编译器必须考虑处理异常的开销，可能会影响一些优化。

使用noexcept基本语法如下：

auto noThrowLambda = []() noexcept { body }
// 这个lambda不会抛出异常

允许抛出异常：

auto mayThrowLambda = [](int x) noexcept(false) {
    if (x == 0) {
        throw std::runtime_error("Division by zero");
    }
    return 10 / x;
};

try {
    mayThrowLambda(0);
} catch (const std::runtime_error& e) {
    std::cout << "Caught exception: " << e.what() << std::endl;
}

/*
在本例中，mayThrowLambda被声明为noexcept(false)，这意味着它可能抛出异常。如果传递的参数为0，它会抛出一个std::runtime_error异常。
*/

条件noexcept，根据某个条件来决定是否抛出异常：

auto conditionalLambda = [](int x) noexcept(noexcept(10 / x)) {
    return 10 / x;
};

try {
    conditionalLambda(0);
} catch (...) {
    std::cout << "Exception caught!" << std::endl;
}

/*
在这个例子中，conditionalLambda的noexcept说明符是条件性的，它取决于表达式10 / x是否会抛出异常。如果x为0，则表达式会抛出异常，noexcept为false；否则，noexcept为true。
*/

参数列表

Lambda表达式的参数列表和普通函数类似，可以接受输入参数。作为可选列表，若无需要可连带括号省去。

C++14中，如果参数类型是泛型，可以使用auto关键字作为类型说明符。例如：

auto y = [] (auto first, auto second)
{
    return first + second;
};

返回类型

返回类型可以省略，编译器会自动推导。

如果 Lambda 体仅包含一个返回语句，则可以省略 Lambda 表达式的 return-type 部分。或者，在表达式未返回值的情况下。如果 lambda 体包含单个返回语句，编译器将从返回表达式的类型推导返回类型。否则，编译器会将返回类型推导为 void。下面的示例代码片段说明了这一原则：

auto x1 = [](int i){ return i; }; // 正确: 返回值为 int
auto x2 = []{ return{ 1, 2 }; };  // 错误: 返回值类型推导为 void
// braked init列表中的返回类型无效

编译过程

当编译器遇到一个lambda表达式时，他会将其转换为一个匿名的类，这个类包含了lambda表达式的所有必要信息和功能：

捕获列表：lambda表达式中捕获的变量会成为这个类的成员变量。
operator()：这个类会重载函数调用运算符operator()，其中包含lambda表达式的实际代码。

用法实例

参考阅读

【回头看之C++】inline内联函数

Mon, 20 May 2024 13:11:00 GMT

特别标注：本文部分内容源于网络，原作链接已标注于“参考阅读”部分，该作品使用 CC BY-SA 4.0 许可发布。本文亦遵循 CC BY-SA 4.0 许可。

回头看系列文章序
自大三起我认识到，随着应用知识的扩展，基础知识的重要性愈加明显。时至今日，已经到了无法忽视的地步，以至于我们必须采取有效措施，认真巩固语言基础、数据库、操作系统等一系列重要基础知识，将零散的知识点体系化，我将这一计划称之为“回头看”。

在C++编程中，inline关键字常被用来提示编译器将函数体直接插入到调用处，通过牺牲代码空间的方法，避免了函数调用的开销，赢得了运行时间。

什么是inline函数？

inline函数是一种建议编译器在调用该函数时，将函数体直接替换到调用位置，而不是进行正常的函数调用。这种优化旨在减少函数调用的开销，特别是对于那些频繁调用的小函数。

声明与定义

要声明一个inline函数，只需在函数定义前加上inline关键字：

inline int add(int a, int b) {
    return a + b;
}

也可以将其与类成员函数结合使用：

class Math {
public:
    inline int multiply(int a, int b) {
        return a * b;
    }
};

工作机制

当编译器遇到inline函数时，会尝试将该函数的代码展开到调用点，类似于宏替换，但不同于宏的是，inline函数在进行替换时会进行类型检查和语法检查。

例如：

inline int square(int x) {
    return x * x;
}

int main() {
    int result = square(5);
    return 0;
}

编译器会将main函数中的square(5)替换为：

int main() {
    int result = 5 * 5;
    return 0;
}

`inline`的局限性和注意事项

使用限制：inline只适合简单的函数使用，不能包含复杂的控制语句，且不能用于递归函数，因为递归调用本质上不能展开为内联代码。
编译器只是建议：inline只是对编译器的建议，编译器不一定会按内联函数进行展开，尤其是当函数体过大或复杂时。
代码膨胀：大量使用inline函数可能导致生成的代码体积增大，因为每次调用都插入了完整的函数体。
调试困难：内联函数的展开可能会使调试过程变得复杂，因为实际执行的代码和源代码可能不完全一致。

隐式内联

现代编译器会智能的一些函数进行内联，即使不显式使用inline关键字，编译器也可能会自动将一些小函数内联展开。

类的成员函数定义在类的声明中时，不需要inline关键字。

例如在结构体中的情形：

#include <iostream>
struct User
{
	char name[256];
    int age;
    void who (void){
	    std::cout << "我是" << name <<"，今年" << age << "岁。" << std::endl;
    }
};
    
int main(int argc, const char * argv[]){
	User user = {"张飞", 25};
    user.who();
    return 0;
}

函数who被声明和定义在结构体User中。该函数会被自动优化为内联函数，成为隐式内联。函数的函数体被编译形成的二进制码将直接替代上述代码中的user.who()，也即：

void who (void){
    std::cout << "我是" << name <<"，今年" << age << "岁。" << std::endl;
    }

宏定义与普通函数

代替普通函数：提高程序运行效率。

普通函数频繁调用的问题

函数调用是有时间和空间开销的。程序在执行一个函数之前需要做一些准备工作，要将实参、局部变量、返回地址以及若干寄存器都压入栈中，然后才能执行函数体中的代码；函数体中的代码执行完毕后还要清理现场，将之前压入栈中的数据都出栈，才能接着执行函数调用位置以后的代码。

栈空间是用于存放程序的局部变量和函数内部数据的内存区域。在计算机系统中，栈空间是有限的。如果频繁且大量地使用栈空间，可能会导致栈空间不足，从而引发程序错误。特别是在函数递归调用时，如果递归深度过大，最终会耗尽栈内存，导致程序崩溃。

当一个函数的代码较多且执行时间较长时，函数调用所花费的时间可以忽略不计。然而，如果一个函数只有一两条简单的语句，那么函数调用本身的开销（如参数传递、栈帧创建和销毁等）就变得相对显著，影响程序的执行效率。

内联函数解决的问题

减少函数调用开销：函数调用需要保存和恢复寄存器、传递参数等，inline函数可以避免这些开销。
代码优化：对于一些简单的、频繁调用的小函数，inline可以让编译器进行更好的优化。

宏定义与内联

内联函数的最初目的：代替部分#define宏定义。

宏定义：预处理指令，在预处理时对所有宏进行替换；
内联函数：函数，在编译阶段把有调用内联函数的地方进行插入；

为什么要用内联函数代替宏定义？

与宏相比，inline函数提供了更安全和可读的代码，因为它们受C++的类型和语法检查约束；
宏的编写有很多限制，例如只能写一行，不能使用return控制流程等；
无法操作类的私有数据成员。

总结

inline关键字是C++中用于优化函数调用的一个有用工具，但应谨慎使用。对于频繁调用的小型函数，inline可以提高性能；但对于大型或复杂的函数，内联可能会导致代码膨胀和维护困难。了解编译器的行为和优化策略，可以帮助开发者更好地利用inline来提升程序性能。

参考阅读

一个计科学生对人工智能和产业发展的小小看法

Tue, 23 Apr 2024 11:00:00 GMT

认真地说，作为一个没有接触过真实生产环境的学生，我是没有资格对生产发表任何看法的，所以我写这篇文章的目的，是想要简单记录和分享一下自己在参加工作之前的观点和看法，多年之后再回头看的时候，不知道自己是否还认可现在的想法呢。

01 正确的认知

过去的记忆

人工智能这个词，在我们这一代人脑子里出现的时间似乎和量子物理等等词汇差不太多，也不记得具体是在中学的哪一年了。那时候我和我周边的孩子们对此的认知应该都是和智能手机上的语音助手有关的，那个时期，仅仅能识别几个固定词句的语音助手很新奇，“人工智障”这个词也很流行。

还记得我在高中时候，第一次在B站上看到张召忠将军关于第四次工业革命的系列视频。视频内容我已经记不清了，但我很清晰地记得我第一次看到第四次工业革命时候的想法。作为一个中学生，对历次工业革命的历程如数家珍，当时我就在想：蒸汽机、内燃机、电力以及信息技术等等一系列技术带来的生产力增长都是爆炸式的，由此但来的产业、社会方面的影响也堪称改天换地，人工智能是什么东西，也配和它们同台比较？

不过很快这样的思想就从一个中学生的脑子里抹掉了，因为越来越多关于自动驾驶、智能识别、新一代军械以及智能调度等等与人工智能相关的信息通过网络、课堂等等各种方式占据了我的思想。不过那时候的我依然无法理解关于产业的信息，最多是把人工智能当作了一个相当厉害的技术。

很快到了大二，随着ChatGPT的爆火，人们对AI的关注度提升到了一个前所未有的地步。站在普通用户角度，我们都对这样一个全新的产品感到好奇，但作为计科专业学生，我们很快展现出了比普通人更多的冷静，我在与好友的交谈中提到：ChatGPT的出现是水到渠成，而非暴力突破，人工智能将带来的首要革命也非C端产品，而是在普通人更少看到的B端带来巨大的产业升级，从IT互联网到工业制造，再到建筑设计施工……这样的革命是全流程全方位的。

从实际出发

去年出，我攥写了《【杂思】聊一聊近期由ChatGPT引起的人工智能热议》这篇文章，行文虽然有些混乱，但也表达了我对人工智能从C to B的理解思路。

自那时起，我在“一切从实际出发”的基础下建立了这样的认知思维：从产业出发认识新技术。对人工智能的理解更是如此，脱离了现有的行业产业，空谈其能力或威胁没有意义。

如同我分析互联网行业的变化那样，在“互联网+”这一概念下，真正的重点并不在互联网本身，而在“+”后面的一系列行业产业，是它们赋予了互联网技术真正的意义：互联网作为重要的基础设施与各个行业深度融合，推动传统行业转型升级和创新发展。在这一观点下，互联网的繁荣来自实体制造业转型的巨大需求，它也必将随着时代需求的转变而逐渐由热转冷，进入基础设施维护的常态化阶段，结束巨大需求带来的病态发展。

对AI来说，这一观点同样适用，人工智能作为通用技术，它的真正价值在于与各行各业结合，解决实际问题，推动“AI+”后面的产业进行前所未有的产业转型，带来生产力的跃升，这也是当前我国推动新一轮科技革命和产业变革的方向。

一句话总结：一切从实际出发，AI技术的真正价值在于与实际产业紧密结合，解决具体问题，推动社会进步。

02 人工智能与人才培养

“人工智能是有史以来第一个能够通过自身发展推动相关人才培养的技术。”我在许多场合表达过这一观点，最近一次是在上周的宣讲里。

从第一次工业革命以来，我们的技术发展过程大致都是这样的：前沿技术工程技术突破→应用技术普及→大规模应用人才培养→新的行业发展成熟……以电气革命为例，首先是以发电机、电动机和变压器等关键设备的发明，使得电力的产生、传输和分配成为可能；随后是电灯、电话、电车等应用技术走进工厂和家庭；在这一基础上电气工程师、技术员相关领域人才需求扩大，教育机构开始开设相关课程和专业；最后催生了电力工业、电子工业以及通信行业等一系列行业的成熟发展。

但人工智能技术的发展出现了与这一过程截然不同的现象：那便是AI的发展前所未有地推进了相关领域的人才培养进程。让我们回顾计算机交互的发展，从纸带到命令行，再到图形化界面，我们走过了极为漫长的过程，在计算机投入实用的相当长一段时间里，它与普通人并无关系。但人工智能，自它推向市场的那一天起，便以最简单的方式拥抱所有人。这一特性，致使人工智能在人才培养方面具有得天独厚的优势，学习人工智能相关技术，乃至算法入门的成本正在前所未有的降低。

当然，由人工智能带来的信息搜集、知识库、模拟评估等技术影响的不仅仅是人工智能技术的教学，更将带来整个人才培养体系的变革，全流程参与人才培养过程，为传统教育带来质的变化。

03 人工智能与IT行业

说起离AI最近的行业，人们很容易想到IT互联网相关的行业。早在C端AI还不那么成熟的年代，人们就在讲“程序员正在杀死程序员”这样的言论。那么代码大模型的出现就首先掀起了这一讨论。

我们当中的绝大多数人，在无穷无尽地重复着同样的工作，也许是在编辑重复的程序逻辑，在故旧的代码里寻找重复的bug，或者就是在cv，然后宣扬着自己由重复工作中得来的经验。实际上，这样的工作已无意义。在大模型的浪潮下，各类AI编码项目如雨后春笋一般出现在各类平台上，从前端编辑到后端代码，这些方案将越来越简便、易用且准确。

在软件工程的整个开发流程中，我们真正需要的便是需求与架构。想象一下，一个对软件开发流程极为熟悉的架构师，他有一个漂亮的idea要实施，曾经他需要组建一个庞大的开发团队，由多个部门联合组建，并由一名专业的产品经理进行流程管理，这个团队要完成他并不熟练的具体开发任务、美术设计、流程管理等等。

而在AI的辅助下，这位架构师的一切短板都被补齐了。整个流程的核心和难点不再是开发环节。

我们再设想另一个场景，在一个制造业企业里，产品部门产生了一个需求，他们需要一个软件对生产过程中的报表进行管理。曾经他们需要详细汇总需求，和IT部门反复对接，确认，待IT部门将整个开发计划全部完成后再动工开发项目，最后再测试、交付、反馈……

而在AI和低代码技术的加持下，工程部门可以根据一个简要的需求快速提出多个方案框架以供需求方选择，以最微小的开发代价获得最贴近需求的最终产品，实现前所未有的敏捷开发。工程部门也由原来的成本中心变为了方案提供者。

总结

在这里，我的描述略微复杂了些，但我的观点依然很简单：AI并非一个孤立的技术，它带来的是整个软件工程思维的转变。当AI技术深度参与软件工程各个环节的时候，人们还在讨论AI的代码有这样或那样的bug，这样或那样的低效，这样的讨论是毫无意义的。它将带来的，是从工程管理、开发思维、产品结构上的全方位改变。只有将关联技术和思想联系起来，我们才能看到这样革命性的变化。

04 第四次工业革命

在讨论这个问题之前，我想再次强调“事物是普遍联系的”这一重要理论。很多时候，我们讨论一二三次工业革命时，把它们隔离地过于明显了。事实上，第几次工业革命只是我们为了区分人类历史上不同阶段而划分的标志性事件，并不意味着某次工业革命仅有那些标志性的技术参与。我们可以很显然地看到，人类历史发展的效果是叠加的，而非并列的。

以高铁为例，作为一个极为复杂的现代交通系统，高铁技术体系涵盖动力、能源、通信、材料、大数据等不知道多少个学科。而这些技术并非一个“第三次工业革命”就可以概括的，从马车算起，到蒸汽机车头、内燃机车，再到电力机车、电话闭塞、空气动力设计、无砟轨道……这是人类历来工业技术的大集合，是各学科发展叠加，交叉融合的产物。

而每一次工业革命的标志性技术也并非一个两个简单的词汇就能概括，随着历史进程的推进，人类技术变革的因素愈加复杂。我们今天可以看到，在当下以人工智能为引领的一系列技术群正在飞速发展，包括云计算、物联网、新能源、生命科学、量子物理等等先进技术。当下，这些技术正以不同速度，不同程度地参与工业生产，而这样的量变势必很快积累，致使生产力发生质的变化。

这将是一场迅猛的革命

此外，我们应当充分预估第四次工业革命带来的质变之迅猛。为便于叙述，我简单地将咱们制造现代化的过程分为三个阶段：工业自动化、数字化和智能化。

改革开放以来，大量制造业企业在我国各地拔地而起，雨后春笋都不足以形容它们发展之迅猛。但在这样迅速的发展背景下，是早一批创业者先进管理经验、运营能力的匮乏。对于那些视野开阔，远见卓识的创业者来说，它们很快就引入了自动化生产线，先进生产经验，击碎了最早那些野蛮生长，效率低下的小厂商，并不断发展成长，走向规模化专业化。

接下来，这些成规模的企业，更加重视引进先进的生产管理理念，精益制造、科学管理等理念深入人心，先进的企业们热衷培养、引进专业的管理人才，领导们也对一系列技术讲座满怀热忱。在这一阶段，数字化的浪潮伴随着精益制造等理念迅速席卷了整个制造行业，一张工业互联网的大网迅速铺开，短短数年间，缔造了当今世界上第一大先进制造业强国。

而产业智能化的过程，比一开始自动化面对的场景要不知道良好多少。今天的智能化进程，面对的是已经高度成熟，高度自动化的先进工厂。在这一背景下，产业智能化的过程将比自动化和数字化来得还要迅猛，影响还要深刻。如果说我们从零开始实现工业自动化，花费了20t的时间，那么从自动化工厂到数字化就只花了10t，而在此基础上实现智能化5t足矣。

05 革命之后-无法预知的未来

我们都知道，每一次工业革命不仅仅会推动生产方式的革新，还将深刻影响产业结构的优化和升级，从而在整体上促进社会生产力的发展。由此带来在产业、社会、文化、经济等各个领域更为广泛的影响。

而革命是一个相当沉重的词汇。它不是变化，不是革新也不是改革。革命是翻天覆地的，足以换了人间。革命前的人们绝无法想象革命之后的场景，也许偶尔能猜中一二，但人类终究无法想象自己从未见过的事物。

例如，第一次工业革命前的人们，你告诉他蒸汽机这一事物，他可以想象到蒸汽机驱动生产机器，甚至安装到车头上替代牲畜，用作蒸汽机车，但他们绝不敢想象，未来替代蒸汽火车的，会是动车组这样一个复杂的技术怪物。你告诉他内燃机这一产物，他也许可以想象到冒烟的汽车，但绝不敢想象化学火箭飞向太空……

于此，我想表达的是，那些关于未来的危言大可收敛，所谓预知未来者也不必装神弄鬼了。作为普通人，我们能做的，只有敬畏革命，积极参与，始终关注，不断思考，在后世历史书中写到的“那时候的人们”里，我们是上进那一派。

【问题解决】Mysql忘记root密码后重置（Widnows）

Sun, 14 Apr 2024 08:57:00 GMT

环境介绍

操作系统：Windows 10 22H2
数据库版本：Mysql 8.0.33 （mysql --help即可查看）
终端环境：Windows terminal cmd

操作步骤

以管理员权限打开cmd，关闭mysql服务

net stop mysql

运行以下指令跳过权限验证登录mysql

mysqld --shared-memory --skip-grant-tables

保持上述窗口，另开一个新的终端窗口，使用以下指令无密码登录mysql

mysql -u root -p

切换到mysql系统数据库，将密码置空，并刷新权限

use mysql;
update user set authentication_string='' where user='root';
flush privileges;

设置加密规则并更新密码，授权并刷新权限（注意修改自己想改的密码）

ALTER USER 'root'@'localhost' IDENTIFIED BY '123456' PASSWORD EXPIRE NEVER; 
alter user 'root'@'localhost' identified by '123456';
grant all privileges  on *.*  to 'root'@'localhost';
flush privileges;

设置完毕后重启mysql服务，并使用新的密码登录

net start mysql

补充了解：正常登录修改用户密码

在知道密码正常登录系统的情况下，有很多种方法可以修改用户密码。在这里简单介绍一种常用的。

正常登录系统后执行以下指令重置对应用户密码

ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';

参考阅读

MySQL修改root用户密码_修改mysql root密码-CSDN博客

自部署Tailscale DERP中继服务器实践分享

Fri, 22 Mar 2024 09:00:00 GMT

在我的个人网络规划中，tailscale的核心地位越来越突出，其作用也非常明显，所以在查阅部分资料，并了解了相关应用后我最终决定自建DERP中继服务器。提高在国内网络环境下的服务质量，进而提高个人网络综合可用性。

环境介绍

云服务商：Huawei CLoud
主机架构：x86-64

操作系统：Debian11.1
tailscale版本：1.62.0

目标环境

Golang 版本：1.22.1（当前官网最新版）
tailscale DERPer服务器

操作步骤

安装Tailscale客户端

安装Tailscale客户端，并完成绑定，参考以往文章tailscale的安装配置和使用 | 光溯星河 (tsio.top )
这里注意，安装完成后不要启动tailscale，或完成绑定后关闭tailscale，因为我出现了tailscale导致的无法联网问题，不知道是不是华为云规则的问题，后续再仔细排查

安装Golang环境

参考文章：Linux 下安装 Golang（适用于1.18及以上版本）_linux 安装golang-CSDN博客

下载Golang，前往官方Release页面挑选适合自己的版本，下载到合适位置
解压文件到/usr/local 目录下

wget https://go.dev/dl/go1.22.1.linux-amd64.tar.gz
tar -C /usr/local -xzf go1.22.1.linux-amd64.tar.gz

打开/etc/profile，严格大小写在文末添加如下配置

#golang env config

export GOROOT=/usr/local/go 
export PATH=$PATH:$GOROOT/bin:$GOPATH/bin

保存并退出后，执行source /etc/profile ，使配置修改生效
使用go version命令验证是否成功安装

安装derper服务

su进入超级用户权限执行以下任务
配置go代理并安装tailscale derper

go env -w GOPROXY=https://goproxy.cn,direct
go install tailscale.com/cmd/derper@main

进入~/go/pkg/mod/[tailscale]/cmd/derper文件夹内执行go编译

go build -o /etc/derp/derper

编译完成后，在该目录下修改cert.go文件，注释以下代码

然后再次编译
执行ls /etc/derp如果显示derper目录则安装成功

注册为系统服务

生成ssl证书，注意修改为自己的域名

openssl req -x509 -newkey rsa:4096 -sha256 -days 3650 -nodes -keyout /etc/derp/derp.test.com.key -out /etc/derp/derp.test.com.crt -subj "/CN=derp.test.com" -addext "subjectAltName=DNS:derp.test.com"

编写derper的配置文件

sudo nano /etc/systemd/system/derper.service

将以下内容写入到derper.service文件中

[Unit]

Description=TS Derper

After=network.target

Wants=network.target

[Service]

User=root

Restart=always

ExecStart=/etc/derp/derper -hostname derp.test.com -a :<端口> -http-port 33446 -certmode manual -certdir /etc/derp --verify-clients

RestartPreventExitStatus=1

[Install]

WantedBy=multi-user.target

注意修改域名和-a后的端口。

放行云服务器相关端口

tailscale直连端口：TCP 41641
derp端口：TCP 与上方文件-a端口保持一致
derp stun端口：UDP 3478

启动tailscale

sudo tailscale up 将tailscale启动
处理iptables端口规则，解决无法连接外网问题

iptables -L --line-numbers #查看当前规则
iptables -D INPUT  #删除num对于的入站规则，本例为1
再输入 iptables -L --line-numbers 就会发现ts-input的规则被删掉了

此时再ping接外网网站就能正常连接了。

启动服务并设置自启规则

sudo systemctl start derper
sudo systemctl enable derper

访问域名+端口看到以下页面表示服务正常运行：

Tailscale Admin后台修改derp服务器

登录后台，进入Access Controls，在ssh前添加如下配置：

	"derpMap": {
		// OmitDefaultRegions 用来忽略官方的中继节点
		"OmitDefaultRegions": true,
		"Regions": {
			// 这里的 901 从 900 开始随便取数字
			"901": {
				// RegionID 和上面的相等
				"RegionID": 901,
				// RegionCode 自己取个易于自己名字
				"RegionCode": "HWCloud-DERP",
				"Nodes": [
					{
						// Name 保持 1不动
						"Name":     "1",
						// 这个也和 RegionID 一样
						"RegionID": 901,
						// 域名
						"HostName": "derp.test.com",
						// 端口号
						"DERPPort": <端口>,
					},
				],
			},
		},
	},

检验

回到终端设备，执行tailscale check，如果DERP latency中显示了刚刚添加的服务器则说明配置添加成功。

参考阅读

【问题解决】Linux修改用户默认Shell环境

Fri, 22 Mar 2024 06:14:00 GMT

最近新入了一台华为云小主机，远程Shell连接后发现默认shell非常难用，无法使用自动补全，命令行抬头也只有提示符，不显示工作路径。

输入echo $SHELL后输出/bin/sh。这表明我们当前用户的默认Shell环境是sh，而不是我们熟悉的bash。我们需要做的事情是将用户默认shell环境改为bash.

环境介绍

操作系统：Debian Linux 11.1
远程工具：Windows Terminal

解决方案

方法一：chsh命令

使用chsh命令修改当前用户shell环境。

$ chsh -s /bin/bash #将当前用户修改为bash
$ egrep 'username' /etc/passwd #查看当前环境是否修改完成
$ exit #退出后重连即可

搜集资料时还发现了其它方案，放在此处以供参考。

方法二：usermod

$ usermod -s /bin/bash username

方法三：临时修改

如果仅需要在当前会话下修改shell环境，仅需执行如下命令.

$ /bin/bash

知识扩展

chsh

chsh 命令是“change shell”的缩写，它在类Unix系统中用于更改用户的登录shell。/bin/bash 是Bash shell的路径，这是一种常用的命令行解释器，广泛用于各种Unix和Linux系统。常见选项如下：

-s ：更换当前用户shell
-l ：列出系统上可用的shell。

-u ：显示更详细的用法信息。

关于几种常见RAID类型的简单辨析

Tue, 19 Mar 2024 12:50:00 GMT

独立硬盘冗余阵列（RAID, Redundant Array of Independent Disks），也有教材上写的是廉价磁盘冗余阵列（Redundant Array of Inexpensive Disks），根据资料显示，Independent这一称谓目前已经完全替代了Inexpensive。不过都不影响我们管它叫RAID就好了。

发展至今，RAID阵列的层级类型非常丰富，不过它们的目的都只有一个：尽可能权衡性能、安全和成本。由此，没有哪种RAID是最好的，只有最适合自己的应用场景的。此外，RAID技术还简化了多块磁盘的管理，开发和管理人员无需关注到具体磁盘，只用关注文件存储即可。

本文将根据我的应用经验和LACIE RAID技术白皮书上的标准分类介绍以下RAID类型：RAID 0、1、10、3、5、6.

**注意：**在实际组建环境中可能会出现与书面标准有出入的情况，可能与阵列卡、磁盘厂商、阵列软件等的实现方式不同有关。

下表是各级RAID的对比表格，详情参阅：中国存储网 (chinastor.com)。

RAID 0

严格意义上讲RAID 0 不是一种“RAID”，因为它并没有实现冗余。RAID 0只是将数据进行条带化处理后分别放入多块磁盘中，这样的存储方式使得RAID 0 可以并行地读写数据，所以RAID 0 的性能是极强的。

特性：条带化
磁盘需求：最少两块
容量计算：n块磁盘的总和
损失一盘后，损失数据的概率：损失一盘就寄了
优点：文件读写性能极高、没有容量损失
缺点：非常不可靠，一旦某一块磁盘损坏，将损失所有数据

简单来说，RAID 0就是直接将数据拆成多份分别存储在多个磁盘中。

RAID 1

相比起RAID 0，RAID 1就是极端的可靠。RAID 1将数据条带化后复制一份存储到另一个磁盘中，即镜像存储，另一块数据还有完整的数据镜像。

特性：镜像
磁盘需求：2的倍数
容量计算：n*磁盘容量/2
损失一盘后，损失数据的概率：1
优点：非常可靠
缺点：读写效率低、磁盘空间利用率低

组合RAID 1和RAID 0

RAID 10 或RAID 01又可以写作RAID 1+0或RAID 0+1，它们叫作组合RAID，组合RAID有很多种形式，不过RAID 1和RAID 0的组合较为常用，也是说明组合RAID非常好的案例。组合RAID的出现便是为了解决RAID 1和RAID 0较为极端地镜像或条带化存储的问题。

RAID 10和RAID 01的区别便是先镜像还是先拆分。

RAID 10

这是一种“镜像集条带”，意思是数据在两个镜像阵列间分条。磁盘阵列先按照RAID 1的方式被分为镜像的两两一组，在写入时则按照RAID 0的方式将数据条带化同时写入两组磁盘中。

特性：镜像后条带化
磁盘需求：4的倍数
容量计算：n*磁盘容量/2
损失一盘后，损失数据的概率：1/3
优点：依靠RAID 0的形式提供了较好的读写速度
缺点：仍然造成了可用容量损失一半

RAID 01

由条带集的镜像组成，读写性能和RAID 10一致。我们假设阵列中Disk 1挂掉后，这时我们已经损失了Disk1和2组成的条带全部数据，Disk 2和3任意挂一个就会损失全盘数据，因此安全性低于RAID 10.

特性：条带化后镜像
磁盘需求：4的倍数
容量计算：n*磁盘容量/2
损失一盘后，损失数据的概率：2/3
优点：依靠RAID 0的形式提供了较好的读写速度
缺点：仍然造成了可用容量损失一半

RAID 3

RAID 3 使用字节级别的条带化技术，并采用专用的奇偶校验磁盘。RAID 3 在要读取连续的长文件（如视频文件）的环境中可提供良好的数据安全性。但是由于专用奇偶校验磁盘会影响随机读取性能，所以对密集使用不连续文件的用户来说，RAID 3 并非理想之选。

特性：奇偶校验以实现数据纠错
磁盘需求：至少两块
容量计算：(n-1)*磁盘容量
损失一盘后，该盘数据可重建到另一磁盘上，若未及时重建时再挂一块将丢失全部数据
优点：数据损失后可恢复
缺点：计算校验影响文件读取性能

RAID 3 + Spare

RAID 3+Spare模式下，阵列中会有一个磁盘保持空置状态。如果阵列中有驱动器发生故障，故障磁盘中的数据就会自动重建到空磁盘（或称为“备用”磁盘）上。

特性：在RAID 3 的基础上将一块磁盘用作备用盘
磁盘需求：至少三块
容量计算： (n-2)*磁盘容量
损失一盘后，该盘数据将被重建至Spare磁盘上
优点：数据损失后可自动恢复
缺点：计算校验影响文件读取性能

RAID 5

RAID 5 综合了 RAID 0 的条带化技术以及阵列数据冗余技术。RAID 5没有像RAID 3那样使用专用的奇偶校验磁盘，数据会在所有磁盘之间分条，并且每个数据块的奇偶校验块 (P) 写入到同一条带上。因此，RAID 5提供了较为均衡的安全策略和空间利用率。RAID 5比较适合用于归档以及要求持续访问数据和追求性能的场景。

特性：将校验码放入存储磁盘中，以减小专用校验盘带来的空间消耗
磁盘需求：至少三块
容量计算：(n-1)*磁盘容量
损失一盘后，该盘数据可重建到另一磁盘上，若未及时重建时再挂一块将丢失全部数据
优点：提供了比RAID 3略高的容量
缺点：性能比RAID 3 差些

RAID 5 + Spare

在RAID 5的基础上将一块磁盘用作备用磁盘，使得系统可以在发生故障后立刻在备用磁盘上重建数据。

特性：在RAID 5 的基础上将一块磁盘用作备用盘
磁盘需求：至少四块
容量计算： (n-2)*磁盘容量
损失一盘后，该盘数据将被重建至Spare磁盘上
优点：数据损失后可自动恢复
缺点：计算校验影响文件读取性能

RAID 6

在RAID 6中，每个数据块都会有两个奇偶校验块，在这种情况下允许挂掉两块磁盘而不损失数据。并且由于两个校验码的存在，RAID 6可以更快地完成数据重建。

特性：两个奇偶校验块
磁盘需求：至少四块
容量计算：(n-2)*磁盘容量
损失一盘后，还能再挂一个，若未及时重建时再挂一块将丢失全部数据
优点：可靠性强
缺点：由奇偶校验带来的性能损失

参考阅读

【随手记】C++中的取整：ceil、floor与round

Thu, 7 Mar 2024 11:50:00 GMT

在大多数编程语言中，默认取整方式为截断取整，而在数学运算中，我们经常需要使用其它取整方式。在C++ cmath中包含了这三类取整函数：向上取整ceil()，向下取整floor()和四舍五入round()。

向上取整 `ceil()`

函数原型：double ceil(doube x)
输入一个浮点值，返回其向上取整结果，默认为一个有六位小数的double值

例：

    int i = ceil(2.2);
    int j = ceil(-2.2);

    printf("The ceil of 2.2 is %d\n", i);
    printf("The ceil of -2.2 is %d\n", j);
    return 0;

输出结果为

The ceil of 2.2 is 3
The ceil of 2.2 is -2

向下取整 `floor()`

函数原型：double floor(doube x)
输入一个浮点值，返回其向下取整结果，默认为一个有六位小数的double值

例：

    int i = floor(2.2);
    int j = floor(-2.2);

    printf("The floor of 2.2 is %d\n", i);
    printf("The floor of -2.2 is %d\n", j);
    return 0;

输出结果为

The floor of 2.2 is 2
The floor of -2.2 is -3

四舍五入 `round()`

函数原型：double floor(doube x)
输入一个浮点值，对其进行四舍五入，默认返回值为double类型

    int i = round(2.2);
    int j = round(2.7);

    printf("The round of 2.2 is %d\n", i);
    printf("The round of 2.7 is %d\n", j);
    return 0;

输出结果为

The round of 2.2 is 2
The round of 2.7 is 3

参考阅读：https://blog.csdn.net/dangzhangjing97/article/details/81279862

基于Tailscale搭建内外隔离的个人网络实践分享

Tue, 27 Feb 2024 06:09:00 GMT

自我接触Tailscale起，我便一直将它用于远程连接RDP、文件传输等服务，直到寒假我开始着手整合手里的计算资源时，我发现我实在是大材小用了。Tailscale提供便捷、快速且高性能的网络穿透服务，以至于我们在组网时候不需要关注网络情况，只需专注于设备和业务即可。

Tailscale是一种基于WireGuard的虚拟组网工具，它可以提供加密的点到点通信，当双方设备无法穿透通信时才会考虑通过第三方节点进行通信。具体原理可以见WireGuard的资料和官方文档。又由于Tailscale本身的便捷性，我们可以很轻松地建立起一个高效运作远程局域网。下面我就简单分享一下我的组网方案。

明确需求

我需要参与组网的设备类型和网络环境较为多样，但也算不上复杂。

设备类型：服务器、PC设备、移动终端
操作系统：Debian Linux、OpenSUSE、Widnows、Android
网络环境：电信家用宽带、联通校园网络（还有学校那抽象的NAT环境）、移动网络、腾讯云、阿里云
服务类型：RDP、FTP、SSH、数据通信、文件传输、Web服务、端口转发

这时候就会想，上面的这些服务使用FRP一样可以实现，为什么要用虚拟局域网呢。

这时便涉及到我对业务的理解和分类了。我将我的个人服务分为公开和私有两个部分。公开服务包括对外提供的博客站点、个人导航、主页等，主要涉及web服务。而私有服务包括RDP、SSH、面板管理等等较为敏感和隐私的服务。FRP提供的tcp数据传输并不是一个理想的方案。当然现在的FRP也可以通过stcp实现类似的效果。不过由以上分析便可以理解我最大的诉求了：内外网隔离，而不是简单的穿透一个或两个服务。如果使用Frp完成组网，那我将需要频繁得处理frpc.toml配置文件，反复增删代理内容。

配置网络

搞定需求之后，便是按照想法去组建网络、配置服务了。Tailscale的登录和配置过程不必多说了，我在以往的文章中（tailscale的安装配置和使用 | 光溯星河 (tsio.top)）详细地讲述过。

我的个人网络拓扑简化示意如下。

我将所有设备通过Tailscale进行连接。其中PC设备主要提供RDP与文件相关服务，重头戏还是在服务器上。出于流量处理上的考虑，我将所有web服务全部使用cloudflare代理，由此会造成一些数据交换问题，我接下来以哪吒监控的部署分享我的隔离方案。

哪吒监控官方文档提供了这样一个解决方案：准备两个域名，一个解析到CDN上，一个直接解析到服务器上用作数据通信。这个方案对于我来说有些困难了。我用于暴露公网的云服务仅有2GB的内存，已经被我霍霍差不多了，那么哪吒监控本体就只能放置在内网服务器中。

于是我便使用云服务器（Server 1）反向代理内网服务器（Server 2）Tailscale v4地址和端口，对外暴露并加挂CDN，便于Github账号认证。而通信域名则直接解析为Tailscale内网地址进行数据交换，直接不过外网。由此便建立了一个内外隔离的网络环境，完成了服务搭建。

总结

其它服务也是一样的，以Tailscale加密通道为核心，辅以防火墙IP限制和服务的监听地址便可将内部服务和数据交换与外网隔离开来，建立一个安全高效的直连通信网络，还可以简化网络拓扑。

不过凡事都有例外。我在使用Tailscale的过程中遇到最大的例外就是我在学校内网环境下的机器，它的连接效率非常低，甚至偶尔会断连。最抽象的是SSH命令输入都是一个字儿一个字儿的蹦。具体问题并没有排查清楚，只能初步猜测是学校的NAT环境过于抽象，导致Tailscale打洞失败了。

光溯星河

公网安备案小记

参考阅读

通用唯一识别码UUID小记

什么是UUID?

标准格式

变体 variant

版本 version

应用场景

一些问题

一些解决问题的方案

UUID 应用实现

Python

MySQL

更多方案

参考阅读

数字化的未来在今日之务实

数字之根在提高生产力

实际见闻

参考阅读

SQLite简介与安装环境配置分享（附多方案连接测试）

SQLite基础知识

数据类型

基本数据类型（存储类）

布尔值与日期时间

数据亲和性

SQLite环境配置

环境介绍

操作步骤

SQLite 命令和语句

基础命令

SQL语句

Navicat SQLite连接测试

C++ SQLite连接测试

测试环境

编译获取库文件

在VS项目中添加对应文件路径

编码测试

Python SQLite连接测试

测试环境

参考阅读

JSON基础知识梳理和Python JSON实践分享

JSON

JSON基本规则

Python JSON

Python和JSON数据结构对照

Python JSON 序列化与反序列化

结合字典的JSON处理实践简要分享

文件读取

CRUD逻辑

参考阅读

【回头看】SQL常用语句和特性整理

数据库结构管理

数据库操作

表管理

视图

索引

约束

触发器

存储过程与函数

基本CRUD操作

查询 SELECT

插入 INSERT

修改 UPDATE

删除 DELETE

连接 JOIN

内连接（INNER JOIN）与全连接（FULL JOIN）

左连接（LEFT JOIN）与右连接（RIGHT JOIN）

交叉连接（CROSS JOIN）

自连接（SELF JOIN）

常用操作符

SQL 操作符

联合 UNION

匹配 LIKE

参考阅读

Git常用命令整理

git配置

创建与提交

远程操作

分支控制