Python ModuleNotFoundError:没有名为';pyarrow.dataset';

Python ModuleNotFoundError:没有名为';pyarrow.dataset';,python,pyarrow,Python,Pyarrow,我决定熟悉arrow软件包。我想这会是一个好机会 运行它的一些用法示例()。 不幸的是,在运行后一个命令控制台后,会产生: 有没有人遇到过类似的问题,或者知道如何解决 我目前正在使用ubuntu 20.04。也许这会导致问题,因为示例是在ubuntu 18.04上设置的,但我看不出有什么办法可以检查出来。在最简单的示例中,这看起来像个bug。请随意 箭头C++包有许多可以打开的特征标志(启用功能)或关闭(加快构建时间和减少依赖性)。依赖于某些特性的python测试应该检查该标志是否存在,如果

我决定熟悉arrow软件包。我想这会是一个好机会 运行它的一些用法示例()。

不幸的是,在运行后一个命令控制台后,会产生:

有没有人遇到过类似的问题,或者知道如何解决


我目前正在使用ubuntu 20.04。也许这会导致问题,因为示例是在ubuntu 18.04上设置的,但我看不出有什么办法可以检查出来。

在最简单的示例中,这看起来像个bug。请随意

箭头C++包有许多可以打开的特征标志(启用功能)或关闭(加快构建时间和减少依赖性)。依赖于某些特性的python测试应该检查该标志是否存在,如果不存在则跳过。这个测试并没有这样做

同时,您可以忽略测试失败,更改测试以跳过(我想这是在代码的上面添加了代码> > PyTest.Mark。DataSet < /COD>),或者将数据集添加到C++构建(可能是我的首选选项)。


< >将数据集添加到C++构建中,可以在代码< > BuffdJavaV.S.< /C> > < /P> >( DARROWGPLACE=/COD>)中添加<代码> -DARROWORDATETET= < P> >,在最小示例中,它看起来像是一个bug。请随意

箭头C++包有许多可以打开的特征标志(启用功能)或关闭(加快构建时间和减少依赖性)。依赖于某些特性的python测试应该检查该标志是否存在,如果不存在则跳过。这个测试并没有这样做

同时,您可以忽略测试失败,更改测试以跳过(我想这是在代码的上面添加了代码> > PyTest.Mark。DataSet < /COD>),或者将数据集添加到C++构建(可能是我的首选选项)。


< >将数据集添加到C++构建中,可以在代码< > BuffdJaveV.S/<代码>下添加<代码> DARROWLDATABET=( DARROWRPPLACE = ON/COD>)。请不要将相关信息作为图像来显示。它们对于视力降低的人来说是不可访问的,不能被正确地搜索,而在您的最后一张图像中,对于任何试图理解内容的人来说都很难阅读。对不起,这是一个很好的观点。我将编辑它,不再犯同样的错误。请不要将相关信息作为图像包含在内-视力下降的人无法访问这些信息,无法正确搜索这些信息-在您的上一张图像中,任何试图理解内容的人都很难读到这些信息。抱歉,这是一个很好的观点。我将编辑它,不再犯同样的错误。我为丢失的标记打开了我为丢失的标记打开了
docker build -t arrow_ubuntu_minimal -f Dockerfile.ubuntu .
docker run --rm -t -i -v $PWD:/io arrow_ubuntu_minimal /io/build_venv.sh
E   ModuleNotFoundError: No module named 'pyarrow._dataset'

pyarrow/dataset.py:23: ModuleNotFoundError
====================================================================================== warnings summary ======================================================================================
pyarrow/tests/test_serialization.py:283
  /root/arrow/python/pyarrow/tests/test_serialization.py:283: PytestDeprecationWarning: @pytest.yield_fixture is deprecated.
  Use @pytest.fixture instead; they are the same.
    @pytest.yield_fixture(scope='session')

pyarrow/tests/test_pandas.py::TestConvertListTypes::test_infer_lists
pyarrow/tests/test_pandas.py::TestConvertListTypes::test_to_list_of_structs_pandas
pyarrow/tests/test_pandas.py::TestConvertListTypes::test_nested_large_list
  /root/venv/lib/python3.6/site-packages/pandas/core/dtypes/missing.py:475: DeprecationWarning: elementwise comparison failed; this will raise an error in the future.
    if np.any(np.asarray(left_value != right_value)):

pyarrow/tests/test_pandas.py::TestConvertListTypes::test_nested_large_list
  /root/venv/lib/python3.6/site-packages/pandas/core/dtypes/missing.py:475: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
    if np.any(np.asarray(left_value != right_value)):

-- Docs: https://docs.pytest.org/en/stable/warnings.html
================================================================================== short test summary info ===================================================================================
FAILED pyarrow/tests/parquet/test_dataset.py::test_write_to_dataset_filesystem - ModuleNotFoundError: No module named 'pyarrow._dataset'
============================================================ 1 failed, 3168 passed, 689 skipped, 16 xfailed, 5 warnings in 48.01s ============================================================
marcin@marcin-G3-3579: