junte-se a dois json no Google Cloud Platform com fluxo de dados

Quero descobrir apenas funcionários do sexo feminino nos dois arquivos JSON diferentes e selecionar apenas os campos nos quais estamos interessados e gravar a saída em outro JSON.

Também estou tentando implementá-lo na plataforma de nuvem do Google usando o Dataflow. Alguém pode fornecer qualquer código Java de amostra que possa ser implementado para obter o resultado.

JSON do funcionário

{"emp_id":"OrgEmp#1","emp_name":"Adam","emp_dept":"OrgDept#1","emp_country":"USA","emp_gender":"female","emp_birth_year":"1980","emp_salary":"$100000"}
{"emp_id":"OrgEmp#1","emp_name":"Scott","emp_dept":"OrgDept#3","emp_country":"USA","emp_gender":"male","emp_birth_year":"1985","emp_salary":"$105000"}

Departamento JSON

{"dept_id":"OrgDept#1","dept_name":"Account","dept_start_year":"1950"}
{"dept_id":"OrgDept#2","dept_name":"IT","dept_start_year":"1990"}
{"dept_id":"OrgDept#3","dept_name":"HR","dept_start_year":"1950"}

O arquivo JSON de saída esperado deve ser como

{"emp_id":"OrgEmp#1","emp_name":"Adam","dept_name":"Account","emp_salary":"$100000"}

questionAnswers(2)

yourAnswerToTheQuestion