Viciously deal with more strictures fallout
[dbsrgits/DBIx-Class.git] / t / lib / DBICTest / Util / LeakTracer.pm
1 package DBICTest::Util::LeakTracer;
2
3 use warnings;
4 use strict;
5
6 use Carp;
7 use Scalar::Util qw(isweak weaken blessed reftype);
8 use DBIx::Class::_Util qw(refcount hrefaddr refdesc);
9 use DBIx::Class::Optional::Dependencies;
10 use Data::Dumper::Concise;
11 use DBICTest::Util 'stacktrace';
12 use constant {
13   CV_TRACING => DBIx::Class::Optional::Dependencies->req_ok_for ('test_leaks_heavy'),
14   SKIP_SCALAR_REFS => ( $] > 5.017 ) ? 1 : 0,
15 };
16
17 use base 'Exporter';
18 our @EXPORT_OK = qw(populate_weakregistry assert_empty_weakregistry visit_refs);
19
20 my $refs_traced = 0;
21 my $leaks_found = 0;
22 my %reg_of_regs;
23
24 sub populate_weakregistry {
25   my ($weak_registry, $target, $note) = @_;
26
27   croak 'Expecting a registry hashref' unless ref $weak_registry eq 'HASH';
28   croak 'Target is not a reference' unless length ref $target;
29
30   my $refaddr = hrefaddr $target;
31
32   # a registry could be fed to itself or another registry via recursive sweeps
33   return $target if $reg_of_regs{$refaddr};
34
35   weaken( $reg_of_regs{ hrefaddr($weak_registry) } = $weak_registry )
36     unless( $reg_of_regs{ hrefaddr($weak_registry) } );
37
38   # an explicit "garbage collection" pass every time we store a ref
39   # if we do not do this the registry will keep growing appearing
40   # as if the traced program is continuously slowly leaking memory
41   for my $reg (values %reg_of_regs) {
42     (defined $reg->{$_}{weakref}) or delete $reg->{$_}
43       for keys %$reg;
44   }
45
46   # FIXME/INVESTIGATE - something fishy is going on with refs to plain
47   # strings, perhaps something to do with the CoW work etc...
48   return $target if SKIP_SCALAR_REFS and reftype($target) eq 'SCALAR';
49
50   if (! defined $weak_registry->{$refaddr}{weakref}) {
51     $weak_registry->{$refaddr} = {
52       stacktrace => stacktrace(1),
53       weakref => $target,
54     };
55     weaken( $weak_registry->{$refaddr}{weakref} );
56     $refs_traced++;
57   }
58
59   my $desc = refdesc $target;
60   $weak_registry->{$refaddr}{slot_names}{$desc} = 1;
61   if ($note) {
62     $note =~ s/\s*\Q$desc\E\s*//g;
63     $weak_registry->{$refaddr}{slot_names}{$note} = 1;
64   }
65
66   $target;
67 }
68
69 # Regenerate the slots names on a thread spawn
70 sub CLONE {
71   my @individual_regs = grep { scalar keys %{$_||{}} } values %reg_of_regs;
72   %reg_of_regs = ();
73
74   for my $reg (@individual_regs) {
75     my @live_slots = grep { defined $_->{weakref} } values %$reg
76       or next;
77
78     $reg = {};  # get a fresh hashref in the new thread ctx
79     weaken( $reg_of_regs{hrefaddr($reg)} = $reg );
80
81     for my $slot_info (@live_slots) {
82       my $new_addr = hrefaddr $slot_info->{weakref};
83
84       # replace all slot names
85       $slot_info->{slot_names} = { map {
86         my $name = $_;
87         $name =~ s/\(0x[0-9A-F]+\)/sprintf ('(%s)', $new_addr)/ieg;
88         ($name => 1);
89       } keys %{$slot_info->{slot_names}} };
90
91       $reg->{$new_addr} = $slot_info;
92     }
93   }
94 }
95
96 sub visit_refs {
97   my $args = { (ref $_[0]) ? %{$_[0]} : @_ };
98
99   $args->{seen_refs} ||= {};
100
101   my $visited_cnt = '0E0';
102   for my $i (0 .. $#{$args->{refs}} ) {
103
104     next unless length ref $args->{refs}[$i]; # not-a-ref
105
106     my $addr = hrefaddr $args->{refs}[$i];
107
108     # no diving into weakregistries
109     next if $reg_of_regs{$addr};
110
111     next if $args->{seen_refs}{$addr}++;
112     $visited_cnt++;
113
114     my $r = $args->{refs}[$i];
115
116     $args->{action}->($r) or next;
117
118     # This may end up being necessarry some day, but do not slow things
119     # down for now
120     #if ( defined( my $t = tied($r) ) ) {
121     #  $visited_cnt += visit_refs({ %$args, refs => [ $t ] });
122     #}
123
124     my $type = reftype $r;
125
126     local $@;
127     eval {
128       if ($type eq 'HASH') {
129         $visited_cnt += visit_refs({ %$args, refs => [ map {
130           ( !isweak($r->{$_}) ) ? $r->{$_} : ()
131         } keys %$r ] });
132       }
133       elsif ($type eq 'ARRAY') {
134         $visited_cnt += visit_refs({ %$args, refs => [ map {
135           ( !isweak($r->[$_]) ) ? $r->[$_] : ()
136         } 0..$#$r ] });
137       }
138       elsif ($type eq 'REF' and !isweak($$r)) {
139         $visited_cnt += visit_refs({ %$args, refs => [ $$r ] });
140       }
141       elsif (CV_TRACING and $type eq 'CODE') {
142         $visited_cnt += visit_refs({ %$args, refs => [ map {
143           ( !isweak($_) ) ? $_ : ()
144         } scalar PadWalker::closed_over($r) ] }); # scalar due to RT#92269
145       }
146       1;
147     } or warn "Could not descend into @{[ refdesc $r ]}: $@\n";
148   }
149   $visited_cnt;
150 }
151
152 sub visit_namespaces {
153   my $args = { (ref $_[0]) ? %{$_[0]} : @_ };
154
155   my $visited = 1;
156
157   $args->{package} ||= '::';
158   $args->{package} = '::' if $args->{package} eq 'main';
159
160   if ( $args->{action}->($args->{package}) ) {
161
162     my $base = $args->{package};
163     $base = '' if $base eq '::';
164
165
166     $visited += visit_namespaces({ %$args, package => $_ }) for map
167       { $_ =~ /(.+?)::$/ ? "${base}::$1" : () }
168       grep
169         { $_ =~ /(?<!^main)::$/ }
170         do {  no strict 'refs'; keys %{ $base . '::'} }
171   }
172
173   return $visited;
174 }
175
176 # compiles a list of addresses stored as globals (possibly even catching
177 # class data in the form of method closures), so we can skip them further on
178 sub symtable_referenced_addresses {
179
180   my $refs_per_pkg;
181
182   my $dummy_addresslist;
183
184   my $seen_refs = {};
185   visit_namespaces(
186     action => sub {
187
188       no strict 'refs';
189
190       my $pkg = shift;
191       $pkg = '' if $pkg eq '::';
192       $pkg .= '::';
193
194       # the unless regex at the end skips some dangerous namespaces outright
195       # (but does not prevent descent)
196       $refs_per_pkg->{$pkg} += visit_refs (
197         seen_refs => $seen_refs,
198
199         # FIXME FIXME FIXME
200         # This is so damn odd - if we feed a constsub {1} (or in fact almost
201         # anything other than the actionsub below, any scalarref will show
202         # up as a leak, trapped by... something...
203         # Ideally we should be able to const this to sub{1} and just return
204         # $seen_refs (in fact it is identical to the dummy list at the end of
205         # a run here). Alas this doesn't seem to work, so punt for now...
206         action => sub { ++$dummy_addresslist->{ hrefaddr $_[0] } },
207
208         refs => [ map { my $sym = $_;
209           # *{"$pkg$sym"}{CODE} won't simply work - MRO-cached CVs are invisible there
210           ( CV_TRACING ? Class::MethodCache::get_cv("${pkg}$sym") : () ),
211
212           ( defined *{"$pkg$sym"}{SCALAR} and length ref ${"$pkg$sym"} and ! isweak( ${"$pkg$sym"} ) )
213             ? ${"$pkg$sym"} : ()
214           ,
215
216           ( map {
217             ( defined *{"$pkg$sym"}{$_} and ! isweak(defined *{"$pkg$sym"}{$_}) )
218               ? *{"$pkg$sym"}{$_}
219               : ()
220           } qw(HASH ARRAY IO GLOB) ),
221
222         } keys %$pkg ],
223       ) unless $pkg =~ /^ :: (?:
224         DB | next | B | .+? ::::ISA (?: ::CACHE ) | Class::C3
225       ) :: $/x;
226     }
227   );
228
229 #  use Devel::Dwarn;
230 #  Ddie [ map
231 #    { { $_ => $refs_per_pkg->{$_} } }
232 #    sort
233 #      {$refs_per_pkg->{$a} <=> $refs_per_pkg->{$b} }
234 #      keys %$refs_per_pkg
235 #  ];
236
237   $seen_refs;
238 }
239
240 sub assert_empty_weakregistry {
241   my ($weak_registry, $quiet) = @_;
242
243   Sub::Defer::undefer_all();
244
245   # in case we hooked bless any extra object creation will wreak
246   # havoc during the assert phase
247   local *CORE::GLOBAL::bless;
248   *CORE::GLOBAL::bless = sub { CORE::bless( $_[0], (@_ > 1) ? $_[1] : caller() ) };
249
250   croak 'Expecting a registry hashref' unless ref $weak_registry eq 'HASH';
251
252   defined $weak_registry->{$_}{weakref} or delete $weak_registry->{$_}
253     for keys %$weak_registry;
254
255   return unless keys %$weak_registry;
256
257   my $tb = eval { Test::Builder->new }
258     or croak "Calling assert_empty_weakregistry in $0 without a loaded Test::Builder makes no sense";
259
260   for my $addr (keys %$weak_registry) {
261     $weak_registry->{$addr}{display_name} = join ' | ', (
262       sort
263         { length $a <=> length $b or $a cmp $b }
264         keys %{$weak_registry->{$addr}{slot_names}}
265     );
266
267     $tb->BAILOUT("!!!! WEAK REGISTRY SLOT $weak_registry->{$addr}{display_name} IS NOT A WEAKREF !!!!")
268       if defined $weak_registry->{$addr}{weakref} and ! isweak( $weak_registry->{$addr}{weakref} );
269   }
270
271   # the symtable walk is very expensive
272   # if we are $quiet (running in an END block) we do not really need to be
273   # that thorough - can get by with only %Sub::Quote::QUOTED
274   delete $weak_registry->{$_} for $quiet
275     ? do {
276       my $refs = {};
277       visit_refs (
278         # only look at the closed over stuffs
279         refs => [ grep { length ref $_ } map { values %{$_->[2]} } grep { ref $_ eq 'ARRAY' } values %Sub::Quote::QUOTED ],
280         seen_refs => $refs,
281         action => sub { 1 },
282       );
283       keys %$refs;
284     }
285     : (
286       # full sumtable walk, starting from ::
287       keys %{ symtable_referenced_addresses() }
288     )
289   ;
290
291   for my $addr (sort { $weak_registry->{$a}{display_name} cmp $weak_registry->{$b}{display_name} } keys %$weak_registry) {
292
293     next if ! defined $weak_registry->{$addr}{weakref};
294
295     $leaks_found++ unless $tb->in_todo;
296     $tb->ok (0, "Leaked $weak_registry->{$addr}{display_name}");
297
298     my $diag = do {
299       local $Data::Dumper::Maxdepth = 1;
300       sprintf "\n%s (refcnt %d) => %s\n",
301         $weak_registry->{$addr}{display_name},
302         refcount($weak_registry->{$addr}{weakref}),
303         (
304           ref($weak_registry->{$addr}{weakref}) eq 'CODE'
305             and
306           B::svref_2object($weak_registry->{$addr}{weakref})->XSUB
307         ) ? '__XSUB__' : Dumper( $weak_registry->{$addr}{weakref} )
308       ;
309     };
310
311     # FIXME - need to add a circular reference seeker based on the visitor
312     # (will need a bunch of modifications, punting with just a stub for now)
313
314     $diag .= Devel::FindRef::track ($weak_registry->{$addr}{weakref}, 50) . "\n"
315       if ( $ENV{TEST_VERBOSE} && eval { require Devel::FindRef });
316
317     $diag =~ s/^/    /mg;
318
319     if (my $stack = $weak_registry->{$addr}{stacktrace}) {
320       $diag .= "    Reference first seen$stack";
321     }
322
323     $tb->diag($diag);
324
325 #    if ($leaks_found == 1) {
326 #      # using the fh dumper due to intermittent buffering issues
327 #      # in case we decide to exit soon after (possibly via _exit)
328 #      require Devel::MAT::Dumper;
329 #      local $Devel::MAT::Dumper::MAX_STRING = -1;
330 #      open( my $fh, '>:raw', "leaked_${addr}_pid$$.pmat" ) or die $!;
331 #      Devel::MAT::Dumper::dumpfh( $fh );
332 #      close ($fh) or die $!;
333 #
334 #      use POSIX;
335 #      POSIX::_exit(1);
336 #    }
337   }
338
339   if (! $quiet and !$leaks_found and ! $tb->in_todo) {
340     $tb->ok(1, sprintf "No leaks found at %s line %d", (caller())[1,2] );
341   }
342 }
343
344 END {
345   if ($INC{'Test/Builder.pm'}) {
346     my $tb = Test::Builder->new;
347
348     # we check for test passage - a leak may be a part of a TODO
349     if ($leaks_found and !$tb->is_passing) {
350
351       $tb->diag(sprintf
352         "\n\n%s\n%s\n\nInstall Devel::FindRef and re-run the test with set "
353       . '$ENV{TEST_VERBOSE} (prove -v) to see a more detailed leak-report'
354       . "\n\n%s\n%s\n\n", ('#' x 16) x 4
355       ) if ( !$ENV{TEST_VERBOSE} or !$INC{'Devel/FindRef.pm'} );
356
357     }
358     else {
359       $tb->note("Auto checked $refs_traced references for leaks - none detected");
360     }
361
362 # Disable this until better times - SQLT and probably other things
363 # still load strictures. Let's just wait until Moo2.0 and go from there
364 =begin for tears
365     # also while we are here and not in plain runmode: make sure we never
366     # loaded any of the strictures XS bullshit (it's a leak in a sense)
367     unless (DBICTest::RunMode->is_plain) {
368       for (qw(indirect multidimensional bareword::filehandles)) {
369         exists $INC{ Module::Runtime::module_notional_filename($_) }
370           and
371         $tb->ok(0, "$_ load apparently attempted!!!" )
372       }
373     }
374 =cut
375
376   }
377 }
378
379 1;