2013-05-22 3 views
1

MY Hive Query выбрасывает это исключение.Недостаточно памяти из-за хеш-карт, используемых в сборе на карте.

Hadoop job information for Stage-1: number of mappers: 6; number of reducers: 1 
2013-05-22 12:08:32,634 Stage-1 map = 0%, reduce = 0% 
2013-05-22 12:09:19,984 Stage-1 map = 100%, reduce = 100% 
Ended Job = job_201305221200_0001 with errors 
Error during job, obtaining debugging information... 
Examining task ID: task_201305221200_0001_m_000007 (and more) from job job_201305221200_0001 
Examining task ID: task_201305221200_0001_m_000003 (and more) from job job_201305221200_0001 
Examining task ID: task_201305221200_0001_m_000001 (and more) from job job_201305221200_0001 

Task with the most failures(4): 
----- 
Task ID: 
    task_201305221200_0001_m_000001 

URL: 
    http://ip-10-134-7-119.ap-southeast-1.compute.internal:9100/taskdetails.jsp?jobid=job_201305221200_0001&tipid=task_201305221200_0001_m_000001 

Possible error: 
    Out of memory due to hash maps used in map-side aggregation. 

Solution: 
    Currently hive.map.aggr.hash.percentmemory is set to 0.5. Try setting it to a lower value. i.e 'set hive.map.aggr.hash.percentmemory = 0.25;' 
----- 

Counters: 
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask 


    select 
     uri, 
     count(*) as hits 
    from 
     iislog 
    where 
     substr(cs_cookie,instr(cs_Cookie,'cwc'),30) like '%CWC%' 
    and uri like '%.aspx%' 
    and logdate = '2013-02-07' 
    group by uri 
    order by hits Desc; 

Я пробовал это на 8 экземплярах ядра EMR с 1 большим экземпляром мастера на 8 ГБ данных. Сначала я попытался использовать внешнюю таблицу (расположение данных - путь к s3). После этого я загрузил данные с S3 в EMR и использовал собственные таблицы hive. Но в обоих случаях у меня такая же ошибка.

FYI, i am using regex serde to parse the iislogs. 

'org.apache.hadoop.hive.contrib.serde2.RegexSerDe' 
       WITH SERDEPROPERTIES (
       "input.regex" ="([0-9-]+) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) (\".*\"|[^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) (\".*\"|[^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) (\".*\"|[^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([0-9-]+ [0-9:.]+) ([^ ]*) ([^ ]*) (\".*\"|[^ ]*) ([0-9-]+ [0-9:.]+)", 
       "output.format.string"="%1$s %2$s %3$s %4$s %5$s %6$s %7$s %8$s %9$s %10$s %11$s %12$s %13$s %14$s %15$s %16$s %17$s %18$s %19$s %20$s %21$s %22$s %23$s %24$s %25$s %26$s %27$s %28$s %29$s %30$s %31$s %32$s") 
location 's3://*******'; 
+0

Я только вижу запрос, но вы говорите, что есть исключение? Пожалуйста, приложите любые сведения о самом исключении. –

+0

@LukasVermeer Ошибка: из-за памяти из-за хэш-карт, используемых при сборе карты. Хотя сейчас я включил детали – Naresh

ответ

1
  • расположение стола не имеет значения для улья.
  • было бы лучше, если вы можете вставить запрос - так что можно выяснить, сортирует ли сортировщик или нет.

    В любом случае - нам нужно увеличить объем памяти. проверьте, сколько памяти задачи карты настроены для работы с (mapred.child ...). должно быть не менее 1G. если это является достаточно большим, вы можете:

    • если картограф не сортировать: рассмотреть натыкаясь агрегат память хэша%, как указано в протоколе к большему числу
    • если картограф сортировка - просто врезаться памятью задач для больший.
+0

Спасибо joydeep ..... да, мой сортировщик сортирует ..... ..i попытался отладить проблему, и выяснилось, что мой картограф использовал 5,5 ГБ ОЗУ. Итак, я увеличил объем оперативной памяти и работал. Перед увеличением ОЗУ я также попытался установить hive.map.aggr.hash.percentmemory = 0.25. Но это не сработало. – Naresh

+0

У меня есть еще один вопрос ... скажем, чтобы уменьшить использование моей памяти, я настраиваю два параметра для создания сжатого вывода. поможет ли это сократить использование ОЗУ? mapred.compress.map.output = true mapred.map.output.compression.codec = org.apache.hadoop.io.compress.GzipCodec – Naresh

1

Вы пробовали настройки set hive.map.aggr.hash.percentmemory = 0.25;, как написано в сообщении? Вы можете прочитать больше here

+0

Привет, sergey Я уже просмотрел эту ссылку. это не помогло. – Naresh