如何通过 cython 将 numpy 数组列表传递给 C++
how to pass list of numpy arrays to c++ via cython
我想将 2d numpy 数组的列表传递给 c++ 函数。我的第一个想法是使用std::vector<float *>
来接收数组列表,但我找不到传递列表的方法。
c++ 函数如下所示:
double cpp_func(const std::vector<const float*>& vec) {
return 0.0;
}
Cython函数是这样的:
cpdef py_func(list list_of_array):
cdef vector[float*] vec
cdef size_t i
cdef size_t n = len(list_of_array)
for i in range(n):
vec.push_back(&list_of_array[i][0][0]) # error: Cannot take address of Python object
return cpp_func(vec)
我尝试过使用list[float[:,:]]
声明list_of_array
,但也不起作用。
我将稍微更改您的函数的签名:
- 对于每个 numpy-array ,函数还需要知道该数组中的元素数量
- 数据
double *
而不是float *
,因为这是默认np.float
-类型对应的数据。但这可以根据您的需求进行调整。
这导致了以下 c++ 接口/代码(为了方便起见,我对 Cython>=0.28 使用 C 逐字代码功能(:
%%cython --cplus -c=-std=c++11
from libcpp.vector cimport vector
cdef extern from *:
"""
struct Numpy1DArray{
double *ptr;
int size;
};
static double cpp_func(const std::vector<Numpy1DArray> &vec){
// Fill with life to see, that it really works:
double res = 0.0;
for(const auto &a : vec){
if(a.size>0)
res+=a.ptr[0];
}
return res;
}
"""
cdef struct Numpy1DArray:
double *ptr
int size
double cpp_func(const vector[Numpy1DArray] &vec)
...
struct Numpy1DArray
只是捆绑了 np 数组所需的信息,因为这不仅仅是指向连续数据的指针。
幼稚版
现在,编写包装器函数非常简单:
%%cython --cplus -c=-std=c++11
....
def call_cpp_func(list_of_arrays):
cdef Numpy1DArray ar_descr
cdef vector[Numpy1DArray] vec
cdef double[::1] ar
for ar in list_of_arrays: # coerse elements to double[::1]
ar_descr.size = ar.size
if ar.size > 0:
ar_descr.ptr = &ar[0]
else:
ar_descr.ptr = NULL # set to nullptr
vec.push_back(ar_descr)
return cpp_func(vec)
有一些事情值得注意:
你需要强制列表- 的元素实现缓冲区协议,否则
&ar[0]
显然不起作用,因为Cython希望ar[0]
是一个Python对象。顺便说一句,这就是你错过的。 - 我选择了Cython的内存视图(即
double[::1]
(作为胁迫的目标。与np.ndarray
相比,它的优点是它也适用于array.array
并且还会自动检查数据是否连续(这就是::1
的含义(。 - 一个常见的陷阱是访问空
ndarray
的ar[0]
- 必须保护此访问。 - 此代码不是线程安全的。另一个线程可能会使指针无效,例如通过就地调整 numpy 数组的大小或完全删除 numpy 数组。
- IIRC,对于 Python 2,您必须
cimport array
代码才能与array.array
一起使用。
最后,这里有一个测试,代码是否有效(列表中还有一个array.array
来说明这一点(:
import array
import numpy as np
lst = (np.full(3, 1.0), np.full(0, 2.0), array.array('d', [2.0]))
call_cpp_func(lst) # 3.0 as expected!
线程安全版本
上面的代码也可以用线程安全的 manier 编写。可能的问题有:
- 另一个线程可以通过调用例如
list_of_arrays.clear()
来触发 numpy-array 的删除 - 之后就不再有数组的引用,它们将被删除。这意味着只要我们使用指针,我们就需要保留对每个输入数组的引用。 - 另一个线程可以调整数组的大小,从而使指针无效。这意味着我们必须使用缓冲区协议 - 它的
__getbuffer__
锁定缓冲区,因此一旦我们完成计算,它就不会失效并通过__releasebuffer__
释放缓冲区。
Cython 的内存视图可用于锁定缓冲区并保留输入数组的引用:
%%cython --cplus -c=-std=c++11
....
def call_cpp_func_safe(list_of_arrays):
cdef Numpy1DArray ar_descr
cdef vector[Numpy1DArray] vec
cdef double[::1] ar
cdef list stay_alive = []
for ar in list_of_arrays: # coerse elements to double[::1]
stay_alive.append(ar) # keep arrays alive and locked
ar_descr.size = ar.size
if ar.size > 0:
ar_descr.ptr = &ar[0]
else:
ar_descr.ptr = NULL # set to nullptr
vec.push_back(ar_descr)
return cpp_func(vec)
开销很小:将内存视图添加到列表中 - 安全的价格。
释放吉尔
最后一个改进:当计算cpp_fun
时,gil 可以释放,这意味着我们必须将cpp_func
导入为 nogil 并释放它,为什么要调用函数:
%%cython --cplus -c=-std=c++11
from libcpp.vector cimport vector
cdef extern from *:
....
double cpp_func(const vector[Numpy1DArray] &vec) nogil
...
def call_cpp_func(list_of_arrays):
...
with nogil:
result = cpp_func(vec)
return result
Cython会发现,result
是双类型,因此能够在调用cpp_func
时释放gil。
相关文章:
- Pybind11:将元组列表从Python传递到C++
- 从链接列表c++中删除一个项目
- 如何(从固定列表中)选择一个数字序列,该序列将与目标数字相加
- C++如何通过用户输入删除列表元素
- 读取文件的最后一行并输入到链接列表时出错
- 复制列表初始化的隐式转换的等级是多少
- LNK2038、MSVS2017 MAGMA的原因列表
- 不能在初始值设定项列表中将非常量表达式从类型 'int' 缩小到'unsigned long long'
- 没有为自己的结构调用列表推回方法
- 使用简单类型列表实现的指数编译时间.为什么
- 一对向量构造函数:初始值设定项列表与显式构造
- 标准是否使用多余的大括号(例如 T{{{10}}})定义列表初始化?
- 通过for循环使用用户输入填充列表
- C++:如何使函数只返回作为列表一部分的字符串
- 概念中的cv限定符需要表达式参数列表
- 下面是我为检测链接列表中的循环而制作的代码
- 建议在运行时将带有类实例的列表从c++导入qml
- 如何维护资源管理器项目视图中当前可见的项目列表
- 在卡萨布兰卡形成编码参数的列表
- 在没有参数列表的情况下使用模板名称"Event"无效,模板问题