std::memcpy vs std::copy_n for legacy c structs

本文关键字：std legacy structs for memcpy vs copy 更新时间：2023-10-16

在处理遗留C代码时，我需要读取并复制C样式结构的内存位置。给定指向结构的指针，我应该更好地使用 C 样式std::memcpy还是C++std::copy_n？还是等价的？

举一个具体但微不足道的例子：

#include <cstring>
#include <algorithm>
struct Ctype {
double x;
int a;
};
int main()
{
Ctype a{1, 2};
auto p = &a;
auto buffer = reinterpret_cast<decltype(p)>(::operator new(sizeof(a)));

// Are the two following equivalent and both well-defined?
std::memcpy(buffer, p, sizeof(a));
std::copy_n(p, 1, buffer);
Ctype b{3, 4};
// Are the two following equivalent and both well-defined?
std::memcpy(&b, buffer, sizeof(b));
std::copy_n(buffer, 1, &b);
delete buffer;
return 0;
}

这个问题出现在序列化 C 结构的上下文中。在具体情况下，我不知道 C 库中定义的Ctype的内容。

一些澄清

这个例子可能过于简化，显然可以简单地使用b=*buffer。但是，我想到的是，buffer可以从外部提供，例如，它可以是从磁盘读取的数据序列。然后我需要主动将缓冲区复制到 b 中。

加法

这是一个更接近我的想法的例子。它使用zlib库从磁盘写入/读取：zlib 函数gzread和gzwrite接受指向内存缓冲区的void *指针进行读/写。

#include <cstring>
#include <algorithm>
#include <fstream>
extern "C" {
#include <zlib.h>
}
struct Ctype {
double x;
int a;
};
int main()
{
Ctype a{1, 2};
auto p = &a;
auto buffer = ::operator new(sizeof(a));
// Are the two following equivalent and both well-defined?
std::memcpy(buffer, p, sizeof(a));
std::copy_n(p, 1, static_cast<Ctype *>(buffer));
// Saving the files
gzFile f = gzopen("conf.dat", "w");
gzwrite(f, buffer, sizeof(a));
gzclose(f);
Ctype b{3, 4};
// Reading file
f = gzopen("conf.dat", "r");
gzread(f, buffer, sizeof(a));
gzclose(f);
// Are the two following equivalent and both well-defined?
std::memcpy(&b, buffer, sizeof(b));
std::copy_n(static_cast<Ctype *>(buffer), 1, &b);
operator delete(buffer);
return 0;
}

std::copy_n

是一个执行复制操作的模板函数。对于平凡可复制的类型(C 样式结构都应该是平凡可复制的(，它与memcpy相同 - 并且应该具有相同的性能。

此外，与std::copy_n不同，memcpy不适合不可复制的类型。

当您尝试复制到不包含对象的存储中时，第一个代码不正确。 Memcpy 和 copy_n 只能更新现有对象，它们不能在空闲存储中创建对象。一个简单的解决方法是编写写auto buffer = new Ctype;(尽管如果您必须使用动态分配，我建议使用容器进行内存管理(。

修复此问题后，您的两个方法对于 C 样式结构(即其定义在 C 中语法有效的结构(都是等效的。这些是 C++ 中简单可复制类型的子集。因此，使用哪种风格是风格问题;我更喜欢写：

b = *buffer;

这似乎比函数调用语法更清晰。 memcpy 版本的一个问题是，在未来代码将结构更改为不再可复制的情况下，它不会是健壮的。