PostgreSQL
La base de données la plus sophistiquée au monde.

Ouverture de session

Navigation

Contactez-nous

Administration du site :
"equipe chez postgresqlfr point org"

Contact presse :
"fr chez postgresql point org"

Contact association :
"bureau chez postgresqlfr point org"

Questions PostgreSQL :
 IRC :
  serveur irc.freenode.net
  canal #postgresqlfr

Recherche

Accéder aux archives

« Octobre 2008  
Lun Mar Mer Jeu Ven Sam Dim
  2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31  

Syndication

Flux XML

Sondage

Quelle est la version de PostgreSQL la plus répandue sur vos serveurs ?
8.3
10%
8.2
42%
8.1
40%
8.0
2%
7.4
6%
7.3 ou antérieure
0%
Nombre de votes: 48

Gel système avec Postgres 7.4.2 sur Suse Enterprise Server 9

Technique - général | Gel système avec Postgres 7.4.2 sur Suse Enterprise Server 9

Par jerome le 06/10/2005 - 11:31

Bonjour,

Merci Ă  ceux qui prendront le temps de lire ce long message.

Dans le cadre d'une infra WEB PHP/PostgreSQL (environ 250 000 pages / jour), j'ai installé un serveur PostgreSQL 7.4.2 sur une Suse Enterprise 9 (Kernel 2.6.5-7.97-smp x86_64) sur une bi-opteron (2 CPU Opteron 240 1,4GHz, 1M Cache) avec 8Go de RAM.

Mon problème est que, plus ou moins régulièrement, le système gêle (environ 1 fois tous les 15 jours), occasionnant un arrêt toujours délicat du service

================================================================================================================

Param système:
/proc/sys/kernel/shmmax: 1 073 741 824
/proc/sys/kernel/shmall: 2 097 152 (valeur par défaut)
/proc/sys/kernel/shmmi : 4 096 (valeur par défaut)

================================================================================================================

Mon fichier de config est le suivant:

# -----------------------------
# PostgreSQL configuration file
# -----------------------------
#
# This file consists of lines of the form:
#
# name = value
#
# (The '=' is optional.) White space may be used. Comments are introduced
# with '#' anywhere on a line. The complete list of option names and
# allowed values can be found in the PostgreSQL documentation. The
# commented-out settings shown in this file represent the default values.
#
# Any option can also be given as a command line switch to the
# postmaster, e.g. 'postmaster -c log_connections=on'. Some options
# can be changed at run-time with the 'SET' SQL command.
#
# This file is read on postmaster startup and when the postmaster
# receives a SIGHUP. If you edit the file on a running system, you have
# to SIGHUP the postmaster for the changes to take effect, or use
# "pg_ctl reload".

#---------------------------------------------------------------------------
# CONNECTIONS AND AUTHENTICATION
#---------------------------------------------------------------------------

# - Connection Settings -

tcpip_socket = true
max_connections = 1024
# note: increasing max_connections costs about 500 bytes of shared
# memory per connection slot, in addition to costs from shared_buffers
# and max_locks_per_transaction.
#superuser_reserved_connections = 2
#port = 5432
#unix_socket_directory = ''
#unix_socket_group = ''
#unix_socket_permissions = 0777 # octal
#virtual_host = '' # what interface to listen on; defaults to any
#rendezvous_name = '' # defaults to the computer name

# - Security & Authentication -

#authentication_timeout = 60 # 1-600, in seconds
#ssl = false
#password_encryption = true
#krb_server_keyfile = ''
#db_user_namespace = false

#---------------------------------------------------------------------------
# RESOURCE USAGE (except WAL)
#---------------------------------------------------------------------------

# - Memory -

#shared_buffers = 1000 # min 16, at least max_connections*2, 8KB each
shared_buffers = 4096
#sort_mem = 1024 # min 64, size in KB
#vacuum_mem = 8192 # min 1024, size in KB

# - Free Space Map -

#max_fsm_pages = 20000 # min max_fsm_relations*16, 6 bytes each
#max_fsm_relations = 1000 # min 100, ~50 bytes each

# - Kernel Resource Usage -

#max_files_per_process = 1000 # min 25
#preload_libraries = ''

#---------------------------------------------------------------------------
# WRITE AHEAD LOG
#---------------------------------------------------------------------------

# - Settings -

#fsync = true # turns forced synchronization on or off
fsync = false
#wal_sync_method = fsync # the default varies across platforms:
# fsync, fdatasync, open_sync, or open_datasync
#wal_buffers = 8 # min 4, 8KB each

# - Checkpoints -

#checkpoint_segments = 3 # in logfile segments, min 1, 16MB each
#checkpoint_timeout = 300 # range 30-3600, in seconds
#checkpoint_warning = 30 # 0 is off, in seconds
#commit_delay = 0 # range 0-100000, in microseconds
#commit_siblings = 5 # range 1-1000

#---------------------------------------------------------------------------
# QUERY TUNING
#---------------------------------------------------------------------------

# - Planner Method Enabling -

#enable_hashagg = true
#enable_hashjoin = true
#enable_indexscan = true
#enable_mergejoin = true
#enable_nestloop = true
#enable_seqscan = true
#enable_sort = true
#enable_tidscan = true

# - Planner Cost Constants -

#effective_cache_size = 1000 # typically 8KB each
#random_page_cost = 4 # units are one sequential page fetch cost
#cpu_tuple_cost = 0.01 # (same)
#cpu_index_tuple_cost = 0.001 # (same)
#cpu_operator_cost = 0.0025 # (same)

# - Genetic Query Optimizer -

#geqo = true
#geqo_threshold = 11
#geqo_effort = 1
#geqo_generations = 0
#geqo_pool_size = 0 # default based on tables in statement,
# range 128-1024
#geqo_selection_bias = 2.0 # range 1.5-2.0

# - Other Planner Options -

#default_statistics_target = 10 # range 1-1000
#from_collapse_limit = 8
#join_collapse_limit = 8 # 1 disables collapsing of explicit JOINs

#---------------------------------------------------------------------------
# ERROR REPORTING AND LOGGING
#---------------------------------------------------------------------------

# - Syslog -

#syslog = 0 # range 0-2; 0=stdout; 1=both; 2=syslog
#syslog_facility = 'LOCAL0'
#syslog_ident = 'postgres'

# - When to Log -

#client_min_messages = notice # Values, in order of decreasing detail:
# debug5, debug4, debug3, debug2, debug1,
# log, info, notice, warning, error

#log_min_messages = notice # Values, in order of decreasing detail:
# debug5, debug4, debug3, debug2, debug1,
# info, notice, warning, error, log, fatal,
# panic

#log_error_verbosity = default # terse, default, or verbose messages

#log_min_error_statement = panic # Values in order of increasing severity:
# debug5, debug4, debug3, debug2, debug1,
# info, notice, warning, error, panic(off)

#log_min_duration_statement = -1 # Log all statements whose
# execution time exceeds the value, in
# milliseconds. Zero prints all queries.
# Minus-one disables.

#silent_mode = false # DO NOT USE without Syslog!

# - What to Log -

#debug_print_parse = false
#debug_print_rewritten = false
#debug_print_plan = false
#debug_pretty_print = false
#log_connections = false
#log_duration = false
#log_pid = false
#log_statement = false
log_timestamp = true
#log_hostname = false
#log_source_port = false

#---------------------------------------------------------------------------
# RUNTIME STATISTICS
#---------------------------------------------------------------------------

# - Statistics Monitoring -

#log_parser_stats = false
#log_planner_stats = false
#log_executor_stats = false
#log_statement_stats = false

# - Query/Index Statistics Collector -

#stats_start_collector = true
#stats_command_string = false
#stats_block_level = false
#stats_row_level = false
#stats_reset_on_server_start = true

#---------------------------------------------------------------------------
# CLIENT CONNECTION DEFAULTS
#---------------------------------------------------------------------------

# - Statement Behavior -

#search_path = '$user,public' # schema names
#check_function_bodies = true
#default_transaction_isolation = 'read committed'
#default_transaction_read_only = false
#statement_timeout = 0 # 0 is disabled, in milliseconds

# - Locale and Formatting -

#datestyle = 'iso, mdy'
#timezone = unknown # actually, defaults to TZ environment setting
#australian_timezones = false
#extra_float_digits = 0 # min -15, max 2
#client_encoding = sql_ascii # actually, defaults to database encoding

# These settings are initialized by initdb -- they may be changed
lc_messages = 'fr_FR.UTF-8' # locale for system error message strings
lc_monetary = 'fr_FR.UTF-8' # locale for monetary formatting
lc_numeric = 'fr_FR.UTF-8' # locale for number formatting
lc_time = 'fr_FR.UTF-8' # locale for time formatting

# - Other Defaults -

#explain_pretty_print = true
#dynamic_library_path = '$libdir'
#max_expr_depth = 10000 # min 10

#---------------------------------------------------------------------------
# LOCK MANAGEMENT
#---------------------------------------------------------------------------

#deadlock_timeout = 1000 # in milliseconds
#max_locks_per_transaction = 64 # min 10, ~260*max_connections bytes each

#---------------------------------------------------------------------------
# VERSION/PLATFORM COMPATIBILITY
#---------------------------------------------------------------------------

# - Previous Postgres Versions -

#add_missing_from = true
#regex_flavor = advanced # advanced, extended, or basic
#sql_inheritance = true

# - Other Platforms & Clients -

#transform_null_equals = false

================================================================================================================

Extrait du fichier de log (j'ai des milliers de lignes du mĂŞme genre)

Oct 5 20:51:55 sgbdmaitre kernel: Unable to handle kernel paging request at 0000001000000068 RIP:
Oct 5 20:51:55 sgbdmaitre kernel: {__vma_prio_tree_remove+63}
Oct 5 20:51:55 sgbdmaitre kernel: PML4 14649067 PGD 0
Oct 5 20:51:55 sgbdmaitre kernel: Oops: 0000 [1] SMP
Oct 5 20:51:55 sgbdmaitre kernel: CPU 0
Oct 5 20:51:55 sgbdmaitre kernel: Pid: 28595, comm: postmaster Not tainted 2.6.5-7.97-smp
Oct 5 20:51:55 sgbdmaitre kernel: RIP: 0010:[] {__vma_prio_tree_remove+63}
Oct 5 20:51:55 sgbdmaitre kernel: RSP: 0018:000001009b599ea8 EFLAGS: 00010206
Oct 5 20:51:55 sgbdmaitre kernel: RAX: 0000000000000000 RBX: 00000100afa36340 RCX: 00000100afa36340
Oct 5 20:51:55 sgbdmaitre kernel: RDX: 00000101fc3b5650 RSI: 00000100afa36340 RDI: 00000101fc3b5688
Oct 5 20:51:55 sgbdmaitre kernel: RBP: 00000100afa36290 R08: 0000001000000000 R09: 000001009b599ee8
Oct 5 20:51:55 sgbdmaitre kernel: R10: 0000002a9664bee8 R11: 0000000000000246 R12: 00000101fc3b5650
Oct 5 20:51:55 sgbdmaitre kernel: R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000
Oct 5 20:51:55 sgbdmaitre kernel: FS: 0000002a96de1aa0(0000) GS:ffffffff804e7e00(0000) knlGS:00000000556ba080
Oct 5 20:51:56 sgbdmaitre kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Oct 5 20:51:56 sgbdmaitre kernel: CR2: 0000001000000068 CR3: 0000000000101000 CR4: 00000000000006e0
Oct 5 20:51:58 sgbdmaitre kernel: Process postmaster (pid: 28595, threadinfo 000001009b598000, task 000001010eb1d310)
Oct 5 20:51:58 sgbdmaitre kernel: Stack: 00000101fc3b56b8 ffffffff80170a2b 0000000000000216 00000100afa36340
Oct 5 20:51:58 sgbdmaitre kernel: 000001010eb1d310 ffffffff80170c52 0000000000000246 0000010010000140
Oct 5 20:51:58 sgbdmaitre kernel: 0000000000000653 0000010028515000
Oct 5 20:51:58 sgbdmaitre kernel: Call Trace:{remove_shared_vm_struct+75} {exit_mmap+514}
Oct 5 20:51:58 sgbdmaitre kernel: {mmput+88} {do_exit+547}
Oct 5 20:51:58 sgbdmaitre kernel: {do_group_exit+232} {system_call+124}
Oct 5 20:51:58 sgbdmaitre kernel:
Oct 5 20:51:58 sgbdmaitre kernel:
Oct 5 20:51:58 sgbdmaitre kernel: Code: 49 39 58 68 74 0c 0f 0b 77 2a 36 80 ff ff ff ff 1e 02 48 85
Oct 5 20:51:58 sgbdmaitre kernel: RIP {__vma_prio_tree_remove+63} RSP <000001009b599ea8>
Oct 5 20:51:58 sgbdmaitre kernel: CR2: 0000001000000068
Oct 5 20:51:58 sgbdmaitre kernel: <1>Unable to handle kernel NULL pointer dereference at 0000000000000028 RIP:
Oct 5 20:51:58 sgbdmaitre kernel: {mm_release+86}
Oct 5 20:51:58 sgbdmaitre kernel: PML4 14649067 PGD 0
Oct 5 20:51:58 sgbdmaitre kernel: Oops: 0000 [2] SMP
Oct 5 20:51:58 sgbdmaitre kernel: CPU 0
Oct 5 20:51:58 sgbdmaitre kernel: Pid: 28595, comm: postmaster Not tainted 2.6.5-7.97-smp
Oct 5 20:51:58 sgbdmaitre kernel: RIP: 0010:[] {mm_release+86}
Oct 5 20:51:58 sgbdmaitre kernel: RSP: 0018:000001009b599c98 EFLAGS: 00010206
Oct 5 20:51:58 sgbdmaitre kernel: RAX: 000001010eb1d310 RBX: 000001010eb1d310 RCX: ffffffff803b1df8
Oct 5 20:51:58 sgbdmaitre kernel: RDX: 000001010eb1d310 RSI: 0000000000000000 RDI: 0000002a96de1b30
Oct 5 20:51:58 sgbdmaitre kernel: RBP: 0000000000000000 R08: 0000000000000040 R09: ffffffff80522880
Oct 5 20:51:59 sgbdmaitre kernel: R10: 00000000000493e0 R11: 0000000000002710 R12: 0000000000000000
Oct 5 20:52:00 sgbdmaitre kernel: R13: 0000000000000000 R14: 0000000000000009 R15: 0000000000000000
Oct 5 20:52:00 sgbdmaitre kernel: FS: 0000002a96de1aa0(0000) GS:ffffffff804e7e00(0000) knlGS:00000000556ba080
Oct 5 20:52:01 sgbdmaitre kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Oct 5 20:52:01 sgbdmaitre kernel: CR2: 0000000000000028 CR3: 0000000000101000 CR4: 00000000000006e0
Oct 5 20:52:02 sgbdmaitre kernel: Process postmaster (pid: 28595, threadinfo 000001009b598000, task 000001010eb1d310)
Oct 5 20:52:02 sgbdmaitre kernel: Stack: ffffffff803b1df0 0000000000000000 0000001000000068 000001010eb1d310
Oct 5 20:52:02 sgbdmaitre kernel: 000001009b599df8 ffffffff8013d7e8 000001010eb1d310 ffffffffffffffef
Oct 5 20:52:02 sgbdmaitre kernel: ffffffff80111cb3 0000000000000001
Oct 5 20:52:02 sgbdmaitre kernel: Call Trace:{do_exit+328} {oops_end+35}
Oct 5 20:52:02 sgbdmaitre kernel: {do_page_fault+1200} {error_exit+0}
Oct 5 20:52:02 sgbdmaitre kernel: {__vma_prio_tree_remove+63} it+232} {system_call+124}
Oct 5 20:52:02 sgbdmaitre kernel:
Oct 5 20:52:02 sgbdmaitre kernel:
Oct 5 20:52:02 sgbdmaitre kernel: Code: 41 8b 45 28 ff c8 7e 63 48 c7 83 78 02 00 00 00 00 00 00 65
Oct 5 20:52:02 sgbdmaitre kernel: RIP {mm_release+86} RSP <000001009b5983d8>
Oct 5 20:52:02 sgbdmaitre kernel: CR2: 0000000000000028
Oct 5 20:52:02 sgbdmaitre kernel: <0>Kernel panic: Aiee, killing interrupt handler!
Oct 5 20:52:02 sgbdmaitre kernel: Unable to handle kernel paging request at fffffffea00080a2 RIP:
Oct 5 20:52:02 sgbdmaitre kernel: []
Oct 5 20:52:02 sgbdmaitre kernel: PML4 103027 PGD 0
Oct 5 20:52:02 sgbdmaitre kernel: Oops: 0010 [15] SMP
Oct 5 20:52:02 sgbdmaitre kernel: CPU 0
Oct 5 20:52:02 sgbdmaitre kernel: Pid: 28595, comm: postmaster Not tainted 2.6.5-7.97-smp
Oct 5 20:52:02 sgbdmaitre kernel: RIP: 0010:[] []
Oct 5 20:52:02 sgbdmaitre kernel: RSP: 0018:000001009b598018 EFLAGS: 00010212
Oct 5 20:52:02 sgbdmaitre kernel: RAX: 00000000a00080a2 RBX: 0000010008367c00 RCX: 00000000c0000100
Oct 5 20:52:02 sgbdmaitre kernel: RDX: 00000100fbe769a0 RSI: 000001010eb1d310 RDI: 000001017c8f4c00
Oct 5 20:52:05 sgbdmaitre kernel: RBP: 0000000000049b18 R08: 000001009b598000 R09: 00000000ffffffff
Oct 5 20:52:05 sgbdmaitre kernel: R10: 0000010097f333c0 R11: 0000000000000000 R12: 0000010008367c98
Oct 5 20:52:05 sgbdmaitre kernel: R13: 000001009b598018 R14: 0000010008367cc8 R15: 0000000000000000
Oct 5 20:52:05 sgbdmaitre kernel: FS: 0000002a96de1aa0(0000) GS:ffffffff804e7e00(0000) knlGS:00000000556ba080
Oct 5 20:52:05 sgbdmaitre kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Oct 5 20:52:05 sgbdmaitre kernel: CR2: fffffffea00080a2 CR3: 0000000000101000 CR4: 00000000000006e0
Oct 5 20:52:05 sgbdmaitre kernel: Process postmaster (pid: 28595, threadinfo 000001009b598000, task 000001010eb1d310)
Oct 5 20:52:05 sgbdmaitre kernel: Stack: 0000000000000000 000001010eb1d310 ffffffff80134fd0 0000010008367ca0
Oct 5 20:52:05 sgbdmaitre kernel: 0000010008367ca0 0000010008367c00 000001009b59808c 0000010008364c00
Oct 5 20:52:05 sgbdmaitre kernel: 0000000000000001 0000000000000001
Oct 5 20:52:05 sgbdmaitre kernel: Call Trace:{default_wake_function+0} {:ext3:ext3_sync_fs+78}
Oct 5 20:52:05 sgbdmaitre kernel: {sync_filesystems+223} {do_sync+49}
Oct 5 20:52:05 sgbdmaitre kernel: {sys_sync+62} {panic+262}
Oct 5 20:52:05 sgbdmaitre kernel: {printk+511} {do_exit+93}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {poke_blanked_console+179} {vt_console_print+727}
Oct 5 20:52:05 sgbdmaitre kernel: {__call_console_drivers+76} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {poke_blanked_console+179}
Oct 5 20:52:05 sgbdmaitre kernel: {vt_console_print+727} {__call_console_drivers+76}
Oct 5 20:52:05 sgbdmaitre kernel: {error_exit+0} {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+47} {do_exit+328}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {poke_blanked_console+179} {vt_console_print+727}
Oct 5 20:52:05 sgbdmaitre kernel: {__call_console_drivers+76} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {poke_blanked_console+179}
Oct 5 20:52:05 sgbdmaitre kernel: {vt_console_print+727} {__call_console_drivers+76}
Oct 5 20:52:05 sgbdmaitre kernel: {error_exit+0} {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+47} {do_exit+328}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {poke_blanked_console+179} {vt_console_print+727}
Oct 5 20:52:05 sgbdmaitre kernel: {__call_console_drivers+76} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {poke_blanked_console+179}
Oct 5 20:52:05 sgbdmaitre kernel: {vt_console_print+727} {__call_console_drivers+76}
Oct 5 20:52:05 sgbdmaitre kernel: {error_exit+0} {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+47} {do_exit+328}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {poke_blanked_console+179} {vt_console_print+727}
Oct 5 20:52:05 sgbdmaitre kernel: {__call_console_drivers+76} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {poke_blanked_console+179}
Oct 5 20:52:05 sgbdmaitre kernel: {vt_console_print+727} {__call_console_drivers+76}
Oct 5 20:52:05 sgbdmaitre kernel: {error_exit+0} {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+47} {do_exit+328}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {poke_blanked_console+179} {vt_console_print+727}
Oct 5 20:52:05 sgbdmaitre kernel: {__call_console_drivers+76} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {poke_blanked_console+179}
Oct 5 20:52:05 sgbdmaitre kernel: {vt_console_print+727} {__call_console_drivers+76}
Oct 5 20:52:05 sgbdmaitre kernel: {error_exit+0} {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+47} {do_exit+328}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {poke_blanked_console+179} {vt_console_print+727}
Oct 5 20:52:05 sgbdmaitre kernel: {__call_console_drivers+76} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {poke_blanked_console+179}
Oct 5 20:52:05 sgbdmaitre kernel: {vt_console_print+727} {__call_console_drivers+76}
Oct 5 20:52:05 sgbdmaitre kernel: {error_exit+0} {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+47} {do_exit+328}
Oct 5 20:52:05 sgbdmaitre kernel: {oops_end+35} {do_page_fault+1200}
Oct 5 20:52:05 sgbdmaitre kernel: {__wake_up_common+64} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86} {mm_release+47}
Oct 5 20:52:05 sgbdmaitre kernel: {do_exit+328} {oops_end+35}
Oct 5 20:52:05 sgbdmaitre kernel: {do_page_fault+1200} {error_exit+0}
Oct 5 20:52:05 sgbdmaitre kernel: {__vma_prio_tree_remove+63} {free_pages_and_swap_cache+116}
Oct 5 20:52:05 sgbdmaitre kernel: {remove_shared_vm_struct+75} {exit_mmap+514}
Oct 5 20:52:05 sgbdmaitre kernel: {mmput+88} {do_exit+547}
Oct 5 20:52:05 sgbdmaitre kernel: {do_group_exit+232} {system_call+124}
Oct 5 20:52:05 sgbdmaitre kernel:
Oct 5 20:52:05 sgbdmaitre kernel:
Oct 5 20:52:05 sgbdmaitre kernel: Code: Bad RIP value.
Oct 5 20:52:05 sgbdmaitre kernel: RIP [] RSP <000001009b598018>
Oct 5 20:52:05 sgbdmaitre kernel: CR2: fffffffea00080a2
Oct 5 20:52:05 sgbdmaitre kernel: <1>Unable to handle kernel NULL pointer dereference at 0000000000000028 RIP:
Oct 5 20:52:05 sgbdmaitre kernel: {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: PML4 83b9b067 PGD 307ab067 PMD 0
Oct 5 20:52:05 sgbdmaitre kernel: Oops: 0000 [16] SMP
Oct 5 20:52:05 sgbdmaitre kernel: CPU 0
Oct 5 20:52:05 sgbdmaitre kernel: Pid: 28595, comm: postmaster Not tainted 2.6.5-7.97-smp
Oct 5 20:52:05 sgbdmaitre kernel: RIP: 0010:[] {mm_release+86}
Oct 5 20:52:05 sgbdmaitre kernel: RSP: 0018:000001009b597e08 EFLAGS: 00010206
Oct 5 20:52:05 sgbdmaitre kernel: RAX: 000001010eb1d310 RBX: 000001010eb1d310 RCX: ffffffff803b1df8
Oct 5 20:52:05 sgbdmaitre kernel: RDX: 000001010eb1d310 RSI: 0000000000000000 RDI: 0000002a96de1b30
Oct 5 20:52:05 sgbdmaitre kernel: RBP: 0000000000000000 R08: 0000000000000040 R09: ffffffff80522880
Oct 5 20:52:06 sgbdmaitre kernel: R10: 0000000000000000 R11: 0000000000000000 R12: 0000000000000000
Oct 5 20:52:06 sgbdmaitre kernel: R13: 0000000000000000 R14: 0000000000000009 R15: 0000000000000000
Oct 5 20:52:06 sgbdmaitre kernel: FS: 0000002a96de1aa0(0000) GS:ffffffff804e7e00(0000) knlGS:00000000556ba080
Oct 5 20:52:06 sgbdmaitre kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Oct 5 20:52:06 sgbdmaitre kernel: CR2: 0000000000000028 CR3: 0000000000101000 CR4: 00000000000006e0
Oct 5 20:52:06 sgbdmaitre kernel: Process postmaster (pid: 28595, threadinfo 000001009b598000, task 000001010eb1d310)
Oct 5 20:52:06 sgbdmaitre kernel: Stack: ffffffff803b1df0 0000000000000000 fffffffea00080a2 000001010eb1d310
Oct 5 20:52:06 sgbdmaitre kernel: 000001009b597f68 ffffffff8013d7e8 ffffffff803b1da0 ffffffffffffffef
Oct 5 20:52:06 sgbdmaitre kernel: ffffffff80111cb3 0000000000000001
Oct 5 20:52:06 sgbdmaitre kernel: Call Trace:{do_exit+328} {oops_end+35}
Oct 5 20:52:06 sgbdmaitre kernel: {do_page_fault+1200} {thread_return+0}
Oct 5 20:52:06 sgbdmaitre kernel: {error_exit+0}
Oct 5 20:52:06 sgbdmaitre kernel:
Oct 5 20:52:06 sgbdmaitre kernel: Code: 41 8b 45 28 ff c8 7e 63 48 c7 83 78 02 00 00 00 00 00 00 65
Oct 5 20:52:06 sgbdmaitre kernel: RIP {mm_release+86} RSP <000001009b597e08>
Oct 5 20:52:06 sgbdmaitre kernel: CR2: 0000000000000028
Oct 5 20:52:06 sgbdmaitre kernel: <1>Unable to handle kernel NULL pointer dereference at 0000000000000028 RIP:
Oct 5 20:52:06 sgbdmaitre kernel: {mm_release+86}
Oct 5 20:52:06 sgbdmaitre kernel: PML4 83b9b067 PGD 307ab067 PMD 0
Oct 5 20:52:06 sgbdmaitre kernel: Oops: 0000 [17] SMP
Oct 5 20:52:06 sgbdmaitre kernel: CPU 0
Oct 5 20:52:06 sgbdmaitre kernel: Pid: 28595, comm: postmaster

================================================================================================================

Voilà. Je ne sais pas quoi faire. Postgres aurait-il des faiblesses lors de fortes charges ? Ou Linux ? Aurais-je un problème matériel ?
J'avoue être un peu désemparé.
Nb: il y onze autres ordinateurs dans notre infrastructure, et seul celui hébergeant PostgreSQL (et rien d'autre) pose problème.

Toute aide serait très appréciée.

Cordialement,

JĂ©rĂ´me

Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur "Sauvegarder les paramètres" pour activer vos changements.

Bonjour Pourriez vous nous

Christophe Chauvet/ = 6 Octobre, 2005 - 14:21

Bonjour

Pourriez vous nous dire si :
- PostgreSQL est installé en paquet ou compiler ?
- Sur quel type de partition est le moteur et le cluster $PGDATA

Cordialement.

Christophe Chauvet.


Re après une brève reche

Christophe Chauvet/ = 6 Octobre, 2005 - 15:06

Re

après une brève recherche sur internet et il semble que c'est un problème de BIOS qui gère mal + de 4Gb de RAM sur les carte mère Tyan (je suppose que c'est ce que vous avez).il y'a le meme problème sur RedhAt
http://lists.suse.com/archive/suse-amd64/2003-Dec/0158.html voici le message de départ de la discution.
http://lists.suse.com/archive/suse-amd64/2003-Dec/0180.html et la conclusion.

Cordialement.

Christophe Chauvet.


Bonjour Et merci pour cett

jerome/ = 6 Octobre, 2005 - 15:16

Bonjour

Et merci pour cette réponse aussi rapide.

Postgres a été installé avec les RPM fournis par Suse (donc en version x86_64)
Toutes mes partitions sont en ext3
Le PGDATA est /var/lib/pgsql/data (valeur par défaut)

MAIS
Un HD (monté sur /disk2 a été ajouté, le 1er s'avérant trop petit, et un lien a été créé de /var/lib/pgsql vers /disk2/pgsql

Les données sont donc en réalité sur /disk2/pgsql/data et les binaires dans /usr/bin (chemins par défaut). On a donc système+SWAP+binaires PG sur /dev/hda et data sur /dev/hdb


Re, Je ne serais vous con

Christophe Chauvet/ = 6 Octobre, 2005 - 15:39

Re,

Je ne serais vous conseiler de mettre un LVM en place, cela vous permet d'augmenter l'espace disque en rajoutant des DD et de les ratachés au système, cette manip est transparente pour PostgreSQL.

Cordialement.

Christophe Chauvet.


Je n'avais pas vu le message

jerome/ = 6 Octobre, 2005 - 15:49

Je n'avais pas vu le message sur les cartes mères (il est arrivé alors que je rédigeais ma réponse précédente)
Ma carte mère est une Rhapsody HDAMA de Arima/AccelerTech
Ceci dit, je vais regarder si je trouve des infos sur ce sujet.

Encore merci,

JĂ©rĂ´me


Mise en place d'un LVM Tou

jerome/ = 6 Octobre, 2005 - 16:02

Mise en place d'un LVM

Tout à fait d'accord, c'est ce que j'aurais dû faire (et c'est ce que je ferai la prochaine fois). Cependant, ça ne résoud pas mon problème.

J'ai trouvé quelques références de kernel panic similaires avec cette carte mère sur le site de Redhat. Suffisemment peu pour ne pas savoir que faire.


Visiblement c'est un problèm

Christophe Chauvet/ = 6 Octobre, 2005 - 17:04

Visiblement c'est un problème avec les BIOS Phoenix, est ce que vous avez sur votre carte mère ?

Cordialement.

Christophe Chauvet.


C'est bien un bios Phoenix.

jerome/ = 6 Octobre, 2005 - 17:43

C'est bien un bios Phoenix.
Connaissez-vous une mise à jour qui corrigerait le problème ou je suis obligé de changer de machine. Et dans cette dernière hypothèse, pour quel matériel ?
Nb: Nous étions initialement parti sur Opteron pour le gain qu'apporte le 64 bits sur les grosses bases (certaines bases "pèsent" environ 70Go)


Est ce un machine assemblé p

Christophe Chauvet/ = 6 Octobre, 2005 - 18:01

Est ce un machine assemblé par vos soin ou acheter chez un fabricant, dans le premier cas, regarder sur le site du Fabricant si une mise à jour est disponible, si vous êtes dans le second cas contacter le fabricant pour savoir si il a à sa disposition un patch qui corrige le problème, je pense que vous n'êtes pas le seul.

Je n'est pas eu l'occasion de tester les Opteron pour le 64Bits, car je me suis tourné vers les serveurs SUN (entre autre V440) mais au dernier salon Solution Linux j'ai rencontré une personne sur le stand de SUN qui m'a fait une démonstration de leur dernier serveur à base d'Opteron, ils sont relativement peu chère comparé au version avec Processeur Sparc. je pense que je vais tester prochainement sur des v40z.

Cordialement;


C'est une machine achetée ch

jerome/ = 6 Octobre, 2005 - 18:15

C'est une machine achetée chez Transtec.
Je vais voir sur leur site, mais sans grande illusion.


regarder du coté des cartes

Christophe Chauvet/ = 6 Octobre, 2005 - 19:38

regarder du coté des cartes mère Tyan elles ont ce bug qui est corrigé

Cordialement.

Christophe Chauvet.


Il semblerait que les cartes

jerome/ = 7 Octobre, 2005 - 10:05

Il semblerait que les cartes mère TYAN soient équipées d'un bios AMI. Sur la Rhapsody, c'est un Phoenix.


Certaine sont équipés de BI

Christophe Chauvet/ = 7 Octobre, 2005 - 10:41

Certaine sont équipés de BIOS Phoenix, appremement les nouvelles ont effectivement un BIOS Ami.

Cordialement.

Christophe Chauvet.


© PostgreSQLFr, tous droits rĂ©servĂ©s.
Site déclaré à la CNIL sous le numéro 1074678, conformément à la Loi en vigueur.