Airflow 气流HDFS传感器
正在尝试使HDFSSensor工作。我已经建立了hdfs连接,文件就在那里,但它一直戳着文件,从未完成 查找文件hdfs://user/airflow/stamps/test/ds=2018-10-15/_成功 代码如下Airflow 气流HDFS传感器,airflow,Airflow,正在尝试使HDFSSensor工作。我已经建立了hdfs连接,文件就在那里,但它一直戳着文件,从未完成 查找文件hdfs://user/airflow/stamps/test/ds=2018-10-15/_成功 代码如下 hdfs_sense_open = HdfsSensor( task_id='hdfs_sense_open', filepath='hdfs://user/airflow/stamps/test/ds=2018-10-15/_SUCCESS',
hdfs_sense_open = HdfsSensor(
task_id='hdfs_sense_open',
filepath='hdfs://user/airflow/stamps/test/ds=2018-10-15/_SUCCESS',
hdfs_conn_id='hdfs_leo',
dag=dag)
实际上,它在路径中没有文件名的情况下工作。我还想在创建hdfs连接时再添加一点,您需要使用hdfs端口号而不是webhdfs端口,即8020(如果是localhost,则可能是9000),但不是像50070这样的webhdfs端口
hdfs_sense_open = HdfsSensor(
task_id='hdfs_sense_open',
filepath='/user/airflow/stamps/test/ds=2018-10-15/',
hdfs_conn_id='hdfs_leo',
dag=dag)
非常感谢你们两位尝试帮助我使用
文件路径
设置而不使用协议。比如:
hdfs_sense_open = HdfsSensor(
task_id='hdfs_sense_open',
filepath='/user/airflow/stamps/test/ds=2018-10-15/_SUCCESS',
hdfs_conn_id='hdfs_leo',
dag=dag)
我以前没有使用过此传感器,但我会尝试将
hdfs://
从filepath
中排除,只使用filepath='/user/aiffair…'
。查看传感器中传递路径的路径,我认为这可能会搞乱检查。实际上,我需要删除/_SUCCESS并只提供包含该文件的文件夹的路径。如果我也能控制文件名,那就太好了