2016-12-13 1 views
0

я должен глотать данные в улей таблицы из HDFS, но я не знаю, как выбрать правильный тип данных для данных, указанных ниже: -Как выбрать тип данных для создания таблицы в улье

  1. $ 34740 $ # $ Disrupt Worldwide LLC $ # $ 40425 $ # $ null $ # $ 13 $ # $ 6 $ # $ 317903 $ # $ null $ # $ Скотт Боди $ # $ + $ # $ null $ # $ 10 $ # $ 0 $ # $ 1 $ # $ 0 $ # $ disruptcentral.com $ # $ null $ # $ null $ # $ $ $ $ $ $ $ $ $ $ $ $ $ Скотт Бодили $ # $ 1220DB56-56D7-E411-80D6-005056A451E3 $ # $ true $ $ 34741 $ # $ Top Tipster Leagues Limited $ # $ 35605 $ # $ null $ # $ 13 $ # $ $ $ $ $ 317902 $ # $ $ $ $ $ $ Поддержка Team $ # $ + 447886 027371 $ # $ null $ # $ 1 $ # $ 1 $ # $ 1 $ # $ 0 $ # $ www.toptiprelegs.co.uk, http://test.toptipsterleague.com $ # $ Jamil Johnson $ # $ Cheng Liem Li $ # $ 1 $ # $ 0.70 $ # $ 1.50 $ # $ 1.30 $ # $ Боно ван Nijnatten $ # $ 0B758BF9-F1D6-E411-80D7-005056A44C5C $ # $ верно $
+0

Насколько я знаю, какой разделитель вы использовали в предыдущих наборах данных? – Farooque

+0

Я использовал мультидемитер '$ # $'. – Rani

+0

как вы обрабатываете первый и последний $ символ в записи? – Farooque

ответ

0

См эту ссылку для различных типов данных,

Click here

Другие, чем все числовые и десятичной поля вы можете использовать тип данных STRING. Для числовых полей, основанных на диапазоне и точности, вы можете использовать INT или DECIMAL.

Использование строки и VARCHAR или любые другие типы строк данных будут читать нуль в ваших данных в виде строки, т.е. «null» для обработки NUL следует отметить свойства таблицы, как показано ниже,

ALTER TABLE tablename SET 
SERDEPROPERTIES ('serialization.null.format' = 'null'); 

Позвольте мне знать, если что-нибудь необходимых для этого.

+0

, когда я использую varchar, string и char beacuse здесь, в некоторых столбцах есть данные, а также нулевые, но когда я пытаюсь использовать varchar для этот столбец дает мне правильный результат, но получает значение null как «null» (что двойное кавычки), как я могу удалить этот (двойной кавычек) «null» в null. – Rani

+0

с использованием varchar и строки в порядке, но он читает значение null как строку типа «null». проверьте мой обновленный ответ. –

+0

Я попытался выполнить команду "ALTER TABLE tablename SET SERDEPROPERTIES ('serialization.null.format' = 'null');" Но получить ошибку. – Rani