贝利信息

C++怎么统计代码行数 C++读取文件统计行数实现【工具】

日期:2026-01-26 00:00 / 作者:穿越時空
std::getline是C++中统计文件行数的首选方式,自动处理换行符、跨平台一致,能正确计空行和末尾无换行符的最后一行;应以getline返回值为循环条件,避免使用!file.eof()。

std::getline 逐行读取最稳妥

直接用 fgetsread 系统调用容易漏判空行、混入 Windows/Linux 换行符(\r\n vs \n),而 std::getline 自动剥离换行符且跨平台行为一致,是 C++ 中统计逻辑行数的首选方式。

关键点:

int count = 0;
std::string line;
std::ifstream file("main.c

pp"); while (std::getline(file, line)) { ++count; } // count 即有效行数

跳过注释和空行需手动判断

std::getline 统计的是「物理行数」,若要统计「有效代码行数」(忽略空白行、单行注释 //、块注释起始行等),必须在读取后做字符串分析。

注意边界情况:

立即学习“C++免费学习笔记(深入)”;

bool is_empty_or_comment(const std::string& s) {
    size_t first = s.find_first_not_of(" \t\r\n");
    return first == std::string::npos || s.substr(first, 2) == "//";
}
// 使用时:if (!is_empty_or_comment(line)) ++code_lines;

大文件下 std::getline 性能足够,无需 mmap

对几 MB 到百 MB 级别的源码文件,std::getline 配合默认缓冲区(通常 8KB)已足够快;实测读取 50MB 文件耗时约 150ms(i7-11800H),远低于编译耗时,没必要上 mmapreadv

只有明确遇到性能瓶颈时才考虑优化:

命令行参数和编码问题最容易被忽略

写成小工具时,用户常传入中文路径或 UTF-8/BOM 文件,而默认 std::ifstream 在 Windows 下用本地 ANSI 编码打开,会导致乱码甚至打不开文件。

解决方案很具体:

实际交付的小工具,90% 的报错都来自路径或 BOM,而不是算法本身。